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本 书 清晰 、 详 细 、 一 步 地 介绍 了 计算 机 组 成 、 eee ee E 
E E 个 抽象 层次 的 方方面面 。 通 过 说 明 不 同 的 抽象 层次 和 其 他 层 ; 
加 的 天 系 ， 本 书 帮助 学 生 将 计算 机 系统 及 其 组 成 部 分 看 作 一 个 统一 的 概念 。 

本 书 基于 Pep/8 汇 编 器 和 模拟 器 ， 用 来 讲授 经 典 冯 … 诺 依 曼 机 器 的 基本 知识 。Pep/8 现 在 包括 新 的 符号 
跟 踊 特 性 ， 能 够 在 学 生 单 步 跟 踪 程序 时 ， 实 时 显示 全 局 变量 和 运行 时 栈 的 情况 。 

作者 Warford 教 授 从 教 30 余 年 ， 他 贯穿 全 书 强调 了 掌握 基本 计算 机 概念 的 重要 性 ， 是 理解 当前 和 未 来 
技术 的 基础 ， 他 还 强调 了 解决 问题 能 力 的 重要 性 。 本 书 覆 盖 了 ACM-IEEE 计 算 机 科学 课程 体系 指导 意见 中 
体系 结构 和 组 成 原理 中 所 有 的 核心 概念 。 
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LERAAR, VTA PS AE ARAL, EPR ae TE BR 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 摹 出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 
日 益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 
战略 上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国家 在 其 计算 
机 科学 发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ，51 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接 
HL. i AEN tA iAH AZ. 

机 械 工业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 。 目 1998 年 开始 ， 我 们 就 将 工作 
重点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson，McGraw-Hill， 
Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 合作 关系 ， 从 
他 们 现 有 的 数 百 种 教材 中 杜 选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, Brain W. Kernighan, 
Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. Ullman, Abraham 
Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. Peterson 等 大 师 
名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 大 理 
石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 上 昂 力 相助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 芝兰 地 担任 了 翻译 和 审 校 的 工作 ;而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ， 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 百 
个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 
深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 入 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 

电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 88379604 

联系 地 址 :北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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Computer Systems, Fourth Edition 


It has been several years since the publication of the Fourth Edition of Computer Systems. 

During that time computer technology has continued to advance. The natural question for this 
translation is, Why is Computer Systems still current after these years since its English publication? 
There are two reasons why it is current and will remain current for many years. 

First, Computer Systems is still current because it teaches the fundamentals of computer systems 
that have been constant for decades. All computer systems consist of software and hardware, and all 
commercial hardware systems are based on the ubiquitous von Neumann cycle. 

On the software side, all high-order languages manipulate data with iterative and recursive 
algorithms. All languages must be translated to lower level machine language to be executed or 
interpreted. On the hardware side, all physical machines are combinational and sequential circuits 
built from logic gates. No matter what the technology, the design principles behind these software and 
hardware systems do not change. 

Second, Computer Systems is still current because it teaches the above design principles with 
the Pep/8 virtual machine. The Pep/8 machine will always be current because it is not subject to 
obsolescence, but rather is built to teach the fundamentals of computer systems that do not change. 
Specifically, it presents a computer system as seven levels of abstraction: 

e Applications 

© High-order languages 

e Assembly 

e Operating system 

® Instruction set architecture 

e Microcode 

© Logic gate 

The book illustrates these levels of abstraction using C++ as the high-order language and 
Pep/8 assembly language and machine language at the lower levels. The strength of this approach 
is that the central concepts of computer science are taught without getting entangled in the many 
irrelevant details that often accompany courses that focus on current technology rather than computing 
fundamentals. Students who learn the fundamentals are better equipped to master whatever new 
technology they will encounter in their future computing careers than they would be if they studied 
only the technology that is current when they are students. | 


本 书 第 4 版 完成 已 经 有 几 年 的 时 间 了 ， 这 期 间 计 算 机 技术 持续 发 展 。 要 出 版 中 文 版 ， 一 
个 很 自然 的 问题 就 是 : 为 什么 英文 版 出 版 多 年 之 后 本 书 的 内 容 仍然 没有 过 时 呢 ? 它 现在 没有 过 
时 ,今后 许多 年 也 不 会 过 时 ， 原 因 有 两 点 。 

首先 ， 本 书 讲授 计算 机 系统 的 基础 知识 ， 这 些 基础 知识 数 十 年 都 没有 改变 过 。 所 有 的 计算 
机 系统 都 是 由 软件 和 硬件 组 成 的 ， 所 有 的 商用 硬件 系统 都 是 基于 普 适 的 冯 : 诺 依 曼 周 期 。 

从 软件 方面 来 说 ， 所 有 的 高 级 语言 都 以 迭代 或 递归 算法 来 处 理 数据 。 所 有 的 语言 都 必须 翻 
译 成 更 低级 的 机 器 语言 才能 执行 或 解释 。 从 硬件 方面 来 说 ， 所 有 的 物理 机 器 都 是 由 逻辑 门 构成 
的 组 合 或 时 序 电路 。 无 论 技 术 如 何 发 展 ， 这 些 软件 和 硬件 系统 背后 的 设计 原理 没有 改变 。 

其 次 ， 本 书 以 Pep/8 虚拟 机 为 例 来 讲授 上 述 设 计 原 理 。Pep/8 机 器 不 会 过 时 ， 因 为 它 不 受 
时 间 限 制 ， 设 计 它 的 初衷 就 是 讲授 计算 机 系统 中 不 会 变化 的 基础 知识 。 具 体 来 说 ， 它 展现 的 是 
计算 机 系统 在 7 个 抽象 层次 上 的 样子 : 

e 应 用 层 

e 高 级 语言 层 

。 汇编 层 

o 操作 系统 层 

o 指令 集 架构 层 

e 微 代码 层 

。 逻辑 门 层 

本 书 在 描述 各 个 抽象 层次 时 使 用 C++ 作为 高 级 语言 ， 在 较 低层 上 使 用 Pep/8 汇编 语言 和 
机 器 语言 。 这 种 方法 的 好 处 就 是 讲授 计算 机 科学 的 核心 概念 ， 而 又 不 会 纠结 于 无 关 的 细节 ， 很 
多 把 重点 放 在 当前 技术 而 不 是 计算 基础 的 课程 通常 都 会 有 这 种 问题 。 比 起 只 学 习 当 前 技术 的 学 
生 ， 学 习 了 基础 知识 的 学 生 在 以 后 的 工作 中 能 更 好 地 掌握 遇 到 的 新 技术 。 


J. Stanley Warford 
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本 书 第 1 版 出 版 于 2010 年 。 在 不 断 感叹 计算 机 技术 发 展 太 快 的 时 候 ，2010 年 的 内 容 会 不 
会 太 “ 老 ” 太 “ 旧 ”了 呢 ? 管 案 显 然 是 否定 的 ， 尤 其 在 读 完了 整 本 书 之 后 。 本 书展 示 了 计算 机 
系统 的 7 个 抽象 层次 : 应 用 层 、 高 级 语言 层 、 汇 编 层 、 操 作 系 统 层 、 指 令 集 架 构 层 、 微 代码 层 
和 逻辑 门 层 。 本 书 的 特色 之 一 就 是 着 眼 于 计算 机 软件 和 硬件 系统 背后 的 设计 原理 ， 而 这 些 原理 
数 年 来 都 未 曾 改 变 过 。 而 且 ， 去 除 那些 眼花 综 乱 的 新 技术 的 表象 ， 能 够 更 好 地 看 清和 理解 系统 
的 本 质 。 

本 书 的 另 一 个 特色 是 建立 了 一 个 虚构 的 计算 机 系统 Pep/8， 借 助 于 这 个 示例 系统 ， 能 够 让 
读者 /学 生 更 具体 地 了 解 计算 机 系统 中 的 各 个 组 成 部 分 ， 进 而 了 解 核心 概念 ， 而 不 是 通过 抽象 
的 描述 学 习 抽 象 的 概念 ; 同时 又 不 必 拘 泥 于 现实 系统 的 实现 细节 。 本 书 覆 盖 广 泛 , 但 又 重点 
突出 ， 强 调 了 人 硬件 及 其 相关 软件 的 实现 。 本 书 文字 简洁 明了 ， 是 非常 合适 的 计算 机 系统 入 门 
教材 。 

与 所 有 计算 机 书籍 的 翻译 一 样 ， 翻 译 过 程 中 充满 了 艰难 的 术语 选择 ， 因 为 我 们 越 来 越 习 惯 
于 在 日 常 技 术 工 作 中 使 用 英文 术语 ， 有 了 时候 使 用 它 的 中 文 翻译 反而 显得 有 些 陌生 和 别扭 。 比 如 
token， 中 文 一 般 译 作 “ 语 言 符 号 ”， 但 是 实际 上 它 有 终结 符 字符 串 的 含义 ， 如 果 翻 译 成 中 文 ， 
很 容易 失去 这 些 意义 。 所 以 我 选择 保留 英文 术语 ， 相 信 不 会 影响 读者 阅读 或 增加 阅读 难度 。 

在 此 感谢 王 文 杰 帮 助 我 一 起 讨论 翻译 中 遇 到 的 问题 ， 还 要 感谢 机 械 工 业 出 版 社 华章 公司 的 
编辑 们 给 了 我 很 多 理解 和 支持 ， 使 得 本 书 得 以 完成 。 

在 翻译 过 程 中 ， 我 尽量 做 到 认真 仔细 ， 但 还 是 难以 避免 出 现 错误 和 不 尽 如 人 意 的 地 方 。 在 
此 欢迎 广大 读者 批评 指正 ， 我 也 会 把 勘误 表 及 时 在 网 上 更 新 ， 便 于 大 家 阅读 。 


Xe FE Fi 
2015 年 $5 月 于 安娜 堡 


| 前 言 


Computer Systems, Fourth Edition 


本 书 清晰 、 详 细 、 循 序 渐进 地 展示 了 计算 机 组 成 、 汇 编 语 言 和 计算 机 体系 结构 中 的 核 
心思 想 。 本 书 的 很 大 一 部 分 是 建立 在 一 个 虚构 的 计算 机 Pep/8 基础 上 的 ， 用 它 来 讲解 经 典 的 
E > 诺 依 曼 机 器 的 基本 概念 。 这 种 方法 的 好 处 是 能 够 讲解 计算 机 科学 的 核心 概念 ， 而 又 不 必 
拘泥 于 此 类 课程 中 常见 的 许多 不 相关 的 细节 。 这 种 方法 还 能 鼓励 学 生 思 考 计 算 机 科学 底层 的 
原理 。 本 书 的 范围 也 比较 广泛 ， 重 点 强调 了 与 硬件 及 其 相关 软件 的 处 理 有 关 而 少 有 提 及 的 计 
算 机 科学 主题 。 


内 容 摘要 


计算 机 运行 在 一 些 抽象 层 上 ， 在 高 级 抽象 层 上 编程 只 是 一 部 分 。 基 于 
图 1 的 层次 结构 ， 本 书展 示 了 计算 机 系统 的 一 个 统一 的 概念 。 


对 应 于 图 1 的 7 层 ， 本 书 也 分 为 7 个 部 分 : 

汇编 层 
App7 层 WHE TAR | 
HOL6 层 ”高 级 语言 层 


ISA3 层 指令 集 架 构 层 

Asmb5 层 汇编 层 

OS4 层 操作 系统 层 

LG1 层 WHITE 

Mc2 层 WREE 

本 书 主要 是 按照 从 上 到 下 、 从 最 高 层 到 最 低层 的 顺序 来 书写 。ISA3 层 
在 Asmb5 层 之 前 以 及 LG1 层 在 Mc2 层 之 前 讲解 是 出 于 教学 的 目的 。 在 这 图 1 i 
两 种 情况 下 ， 暂 时 用 相反 的 从 下 至 上 的 方法 来 讲解 更 自然 ， 有 了 低层 的 构 结构 
造 模块 就 很 容易 完成 上 层 的 构建 。 

App7 & App 层 是 单独 一 章 ， 介 绍 了 应 用 程序 。 本 章 展 示 了 抽象 层次 的 概念 ， 建 立 
本 书 剩 下 部 分 的 框架 。 还 介绍 了 一 些 关 系数 据 库 的 概念 ， 作 为 典型 计算 机 应 用 的 例子 。 同 
时 ， 还 假设 学 生 对 文字 编辑 器 或 文字 处 理 器 有 一 定 的 经 验 。 

HOL6 E HOL6 层 也 是 一 章 ， 复 习 了 C++ 编程 语言 。 本 章 假 设 学 生 具 有 某 种 命令 语言 
的 经 验 ， 不 一 定 是 C++， 可 以 是 Java 或 C。 书 中 避免 了 C++ 的 高 级 特性 ， 包 括 面向 对 象 的 
概念 。 如 果 有 必要 ， 教 师 可 以 把 C++ 例子 翻译 成 其 他 HOL6 层 的 语言 。 

本 章 着 重 介 绍 了 C++ 内 存 模型 ， 包 括 全 局 变量 和 局 部 变量 、 函 数 参数 以 及 动态 分 配 的 
变量 。 也 介绍 了 递归 的 问题 ， 因 为 它 依赖 于 运行 时 栈 上 的 内 存 分 配 机 制 。 还 相当 详细 地 解释 
了 函数 调用 的 内 存 分 配 过 程 ， 因 为 本 书后 面 还 会 在 较 低 抽象 层次 上 分 析 这 个 机 制 。 

ISA3 Æ ISA3 层 是 指令 集 架 构 层 ， 包 括 两 章 ， 描 述 了 一 个 用 于 说 明 计 算 机 概念 的 虚 
构 的 Pep/8 计算 机 。Pep/8 是 经 典 的 汉 : 诺 依 曼 机 器 。CPU 包含 一 个 累加 器 、 一 个 变 址 寄存 
器 、 一 个 程序 计数 器 、 一 个 栈 指针 和 一 个 指令 寄存 器 。 有 8 种 寻 址 方式 : 立即 数 、 直 接 、 间 
接 、 栈 相对 、 栈 相对 间接 、 变 址 、 栈 变 址 和 栈 变 址 间接 。 在 模拟 的 只 读 存 储 器 (ROM) 中 ， 
Pep/8 操作 系统 能 从 学 生 的 文本 文件 中 装 和 信和 执行 十 六 进 制 格式 的 程序 。 学 生 可 以 在 Pep/8 





Vill 


模拟 器 上 运行 小 程序 ， 学 习 不 会 改变 内 存 值 的 ROM 存储 指令 。 

学 生 能 学 习 到 位 层 的 信息 表示 和 计算 机 组 成 的 知识 。 因 为 本 书 的 中 心 主 题 是 层次 之 间 
的 关系 ， 所 以 有 关 Pep/8 的 章节 展示 了 ASCI 表示 (ISA3 层 ) 和 类 型 为 char 的 C++ 变量 
( HOL6 层 ) 之 间 的 关系 。 还 展示 了 补 码 表示 (ISA3 层 ) 和 类 型 为 int 的 C++ 变量 ( HOL6 ) 
之 间 的 关系 。 

Asmb5 Æ Asmb5 层 是 汇编 层 ， 书 中 介绍 了 汇编 融 的 概念 (汇编 器 是 汇编 导 和 机 咽 层 
之 间 的 翻译 器 )， 还 介绍 了 Asmb5 层 的 符号 和 符号 表 。 

这 里 是 统一 的 方法 派 上 用 场 的 地 方 。 第 $ 章 和 第 6 章 中 的 编译 器 是 高 级 语言 到 汇编 语言 
的 翻译 器 。 前 面 ， 学 生 学 习 了 一 种 具体 的 HOL6 层 语 言 C++ 和 一 种 具体 的 汉 ，… 诺 依 曼 机 器 
Pep/8。 接 下 来 的 章节 将 继续 介绍 层次 之 间 的 关系 ， 讲述 下 面 这 样 一 些 对 应 关系 : (a) HOL6 
层 的 赋值 语句 和 Asmbs 层 的 装 人 /存储 指令 ; (b) HOL6 层 的 循环 和 if 语句 与 Asmb5 层 的 
分 支 指令 ; (c) HOL6 层 的 数组 和 Asmbs 层 的 变 址 寻 址 ; (d) HOL6 层 的 过 程 调用 和 Asmb5 
层 的 运行 时 栈 ; (e) HOL6 EM RMA EB RAS Asmb5 层 的 栈 相 对 寻 址 ; (f) HOL6 层 的 
switch 语句 和 Asmbs 层 的 转移 表 ;(g) HOL6 层 的 指针 和 Asmbs 层 的 地 址 。 

统一 方法 之 美 就 在 于 可 以 在 较 低 层次 上 实现 C++ 章节 中 的 例子 。 例 如 ， 第 2 章 的 递归 
例子 中 描述 的 运行 时 栈 直 接 对 应 于 Pep/8 主 存 中 的 硬件 栈 。 学 生 可 以 用 手动 方式 直接 在 两 层 
之 间 翻 译 ， 以 便 更 好 地 理解 编译 的 过 程 。 

这 种 方法 为 讨论 计算 机 科学 中 的 核心 问题 提供 了 一 种 很 自然 的 环境 。 例 如 ， 本 书 介绍 了 
HOL6 层 的 结构 化 编程 ， 可 以 和 Asmbs 层 的 非 结 构 化 编程 的 可 能 性 进行 对 比 。 书 中 讨论 了 
goto 争议 、 结 构 化 编程 /效率 之 间 的 折 中 ， 给 出 了 两 个 层次 上 语言 的 实际 例子 。 

第 7 章 向 学 生 介 绍 了 计算 机 科学 理论 。 既然 学 生 对 如 何 把 高 级 语言 翻译 成 汇编 语言 已 经 
有 了 感性 的 认识 ， 那 么 我 们 就 提出 所 有 计算 中 最 基本 的 问题 : 什么 是 能 够 被 自动 化 的 ?这 里 
介绍 理论 是 很 自然 的 ， 因 为 学 生 现 在 知道 了 编译 器 (自动 化 翻译 器 ) 必须 做 什么 。 他 们 通过 
识别 C++ 和 Pep/8 汇编 语言 的 语言 符号 来 学 习 语 法 分 析 和 有 限 状 态 机 一 一 确定 性 的 和 非 确 
定性 的 。 本 章 包括 两 种 小 语言 之 间 的 自动 翻译 器 ， 说 明了 词法 分 析 、 语 法 分 析 和 代码 生成 。 
词法 分 析 器 是 有 限 状 态 机 的 实现 。 还 有 什么 比 这 样 更 自然 的 介绍 理论 的 方法 呢 ? 

OS4 层 OS4 层 讲述 操作 系统 ,分 为 两 章 。 第 8 章 讲述 进程 管理 ,包括 两 节 ， 一 节 讲 
装载 器 ， 一 节 讲 陷阱 处 理 程序 ， 说 明了 Pep/8 操作 系统 的 概念 。 有 5 条 指令 具有 产生 软件 陷 
阱 的 未 实现 操作 码 。 操 作 系统 把 用 户 正 在 运行 的 进程 的 进程 控制 块 存 储 在 系统 栈 上 ， 中 断 服 
务 例 程 解释 该 指令 。 通 过 具体 实现 一 个 挂 起 进程 来 强化 操作 系统 中 运行 和 等 待 进程 的 经 典 状 
态 转移 图 。 本 章 结尾 描述 了 并 发 进程 和 死 锁 。 第 9 章 描 述 存储 管理 ， 包 括 主 存 和 磁盘 存储 器 。 

LG1 层 LGI 层 用 两 章 来 介绍 组 合 电路 和 时 序 电 路 。 从 布尔 代数 的 定理 开始 ， 第 10 章 
重点 介绍 计算 机 科学 的 数学 基础 的 重要 性 ， 展 示 布 尔 代数 和 逻辑 门 之 间 的 关系 ， 然 后 介绍 一 
些 常见 的 SSI 和 MSI 逻辑 设备 ， 包 括 Pep/8 ALU 的 完整 的 逻辑 设计 。 第 11 章 通过 介绍 时 序 
电路 的 状态 转移 图 ， 描 述 有 限 状 态 机 的 基本 概念 。 最 后 描述 常见 的 计算 机 子 系统 ， 比 如 双 回 
总 线 、 内 存 芯 片 和 双 端 口 存储 器 体 。 

Mc2 层 第 12 章 描述 Pep/8 CPU 的 微 程 序 设计 控制 区 ， 给 出 了 一 些 示例 指令 和 寻 址 方 
式 的 控制 序列 ， 还 提供 了 有 关 其 他 指令 和 和 寻 址 方式 的 大 量 练 习 。 本 章 还 介绍 了 装 入 / 存储 体 
系 结构 的 概念 ， 对 比 了 MIPS AY RISC 机 器 和 Pep/8 CISC 机 器 。 最 后 描述 了 高 速 缓存 、 流 水 
线 、 动 态 分 支 预测 和 超标 量 机 器 ， 介 绍 了 一 些 性 能 问题 。 





在 课程 中 的 使 用 

本 书 覆 盖 的 内 容 广 泛 ， 教 师 在 设计 课程 时 可 以 省 略 一 些 内 容 。 第 1 ~ 5 章 可 以 看 作 核 
>, 第 6 一 12 章 可 以 有 所 取舍。 

本 书 第 上 一 $ 章 必 须 顺 序 讲授 ， 第 6 章 和 第 7 章 可 以 按 任意 顺序 讲授 。 我 通常 会 省 略 第 
6 章 而 直接 讲 第 7 章 ， 开 始 一 个 大 的 软件 项 目 一 一 为 Pep/8 汇编 语言 的 一 个 子 集 写 一 个 汇编 


人 希 ， 这 样 学 生 在 一 学 期 中 有 足够 的 时 间 完 成 6) 
Eo Bl 章 显 然 依 赖 于 第 10 章 ， 但 是 它们 @ 
都 不 依赖 于 第 9 章 ， 所 以 第 9 章 可 以 省 略 。 ~O— -O—-o—-O QO 


E) 
图 2 是 一 个 章节 依赖 图 ， 图 中 总 结 了 可 以 省 
略 哪些 章节 。 图 2 章节 依赖 图 
辅助 资料 


下 面 列 出 的 辅助 资料 可 以 从 出 版 社 网 站 获得 : 

http://www.jbpub.com/catalog/9780763771447/ 

Pep/8 汇编 器 和 模拟 器 ”Pep/8 机 器 在 MS Windows, Mac OS X 和 UNIX/Linux 系统 上 
都 有 。 汇 编 句 的 特性 包括 : 

o FEN CF Bae ae ; 

e 在 源 代码 中 发 现 错误 的 地 方 插入 红色 字体 的 错误 消息 ; 

o 对 学 生 友好 的 、 十 六 进 制 格式 的 机 器 语言 目标 代码 ; 

o 能 够 直接 以 机 器 语言 编写 代码 ， 跳 过 汇编 句 ; 

e 能 够 重 定 义 触发 同步 陷阱 的 未 实现 操作 码 的 助 记 符 。 

模拟 器 的 特性 包括 : 

e 模拟 的 ROM， 装 入 指令 不 能 修改 ; 

e 在 模拟 的 ROM 中 烧 入 了 一 个 小 的 操作 系统 ， 包 括 一 个 装载 器 和 一 个 陷阱 处 理 程序 ; 

e 一 个 集成 的 调试 硕 ， 人 允许 设置 断 点 、 单 步 执行 、CPU 跟踪 和 内 和 存 跟踪 ; 

e 用 户 定义 的 、 从 无 限 循环 恢复 的 语句 执行 计数 的 上 限 ; 

o 能 够 通过 为 未 实现 操作 码 设 计 新 的 陷阱 处 理 程 序 来 修改 操作 系统 。 

Pep/8 CPU 模拟 器 CPU 模拟 器 ， 有 MS Windows, Mac OS X 和 UNIX/Linux 系统 版 
本 ， 可 以 用 在 计算 机 组 成 课程 中 。CPU 模拟 器 的 特性 包括 : 

© 颜色 编码 的 展示 通路 ， 根 据 控制 信号 跟踪 复 用 器 的 数据 流 ; 

o 操作 的 单 周 期 模式 ， 用 GUI 输入 每 个 控制 信号 ， 立 即 展示 信和 叶 的 效果 ; 

e 操作 的 多 周期 模式 ， 学 生 可 以 在 集成 的 文字 编辑 器 中 编写 Mc2 微 代 码 序 列 并 执行 它 

们 以 便 实 现 ISA3 指令 。 

课程 课件 ”每 草 有 50 ~ 125 页 的 课程 约 灯 片 ， 有 Keynote 和 PDF 格式 。 约 灯 片 包括 课 
本 中 所 有 的 图 和 总 结 信息 ， 通 篆 以 标号 的 形式 给 出 。 不 过 其 中 没有 太 多 的 例子 ， 给 教师 展示 
示例 和 教师 指导 讨论 留 出 了 空间 。 

考试 题目 提供 有 一 组 考试 题目 ， 包 括 参 考 信息 ， 例 如 ASCI 表 、 指 令 集 表 等 ， 供 考 
试 和 自学 之 用 。 这 些 对 用 本 书 作为 教材 的 教师 开放 。 

数字 电路 实验 有 一 组 6 个 数字 电路 实验 ， 能 够 让 学 生 在 物理 实验 电路 板 上 亲身 体验 。 
这 些 实验 说 明了 第 10 章 和 第 11 章 的 组 合 和 时 序 设 备 ， 使 用 许多 本 书 中 没 讲 到 的 电路 。 学 生 


可 以 目 学 实际 的 电子 设计 和 实现 概念 ， 这 些 超出 了 本 书 的 讲述 范围 ， 它 们 可 以 按照 书 中 讨论 
的 主题 顺序 ， 从 组 合 电路 开始 ， 然 后 是 时 序 电 路 和 ALU。 

答案 手册 附录 中 有 部 分 练习 的 答案 。 剩 下 练习 的 答案 对 用 本 书 作为 教材 的 教师 开 
放 。 出 于 安全 原因 ， 答 案 直 接 从 出 版 社 获 取 。 相 关 信 息 请 联系 Jones 和 Bartlett Publishers 
Representative, Hii 1-800-832-0034。 


第 4 版 所 做 的 修改 


第 4 版 对 第 3 版 做 了 大 量 修改 ， 包括 使 用 了 Pep/8， 它 是 对 Pep/7 架构 的 彻底 重新 设计 。 
前 几 版 的 用 户 已 经 接受 了 Pep/8 的 教学 特性 ， 第 4 版 中 还 是 保留 了 Pep/8 架构 。 本 版 的 每 一 
章 都 有 改进 ， 下 面 只 列 出 了 其 中 一 些 主要 的 : 


改进 了 C++ 回顾 一 一 扩展 了 第 3 版 中 引入 的 C++ 内 存 模型 ， 更 系统 地 从 头 开始 描 
述 。 内 存 分 配 图 更 现实 ， 与 主 图 数 一 致 ， 显 示 了 对 主 函 数 返回 地 址 和 返回 值 的 分 配 。 
重 命名 了 所 有 以 前 命名 为 i 的 变量 。 当 程序 翻译 成 Pep/8 汇编 语言 后 容易 有 误会 ， 
Pep/8 汇编 语言 用 字母 i 表示 立即 数 寻 址 。 

改进 了 字符 编码 的 内 容 一 一 讲述 了 Unicode FRÆ, ÆT EBCDIC. 

跟踪 标签 一 一 Pep/8 汇编 右 和 模拟 器 包括 一 个 新 的 符号 跟踪 特性 ， 当 用 户 单 步 跟 踪 
程序 时 ， 能 够 实时 显示 全 局 变量 和 运行 时 栈 。 使 用 这 个 新 特性 要 求 程 序 员 在 某 些 汇 
编 语 言语 句 的 注释 字段 放置 跟踪 标签 ， 翻 译 器 将 忽略 这 些 标签 ， 但 是 调试 器 将 使 用 
它们 。 跟 踩 标签 的 一 个 巨大 好 处 是 迫使 程序 员 做 好 文件 说 明 。 要 使 用 调试 器 ， 学 生 
必须 在 注释 字段 精确 说 明 哪 些 变量 要 在 运行 时 栈 上 分 配 以 及 分 配 的 顺序 。 汇 编 器 验 
证 分 配 的 字 节 数 是 否 与 变量 列表 要 求 的 字 节 数 匹配 。 跟 踪 标 签 的 文件 说 明 优点 很 大 ， 
现在 这 个 版 本 中 描述 了 跟踪 标签 语法 ， 书 中 和 答案 手册 中 的 每 个 汇编 语言 程序 中 都 
包括 了 跟踪 标签 。 | 

改进 了 语言 翻译 的 内 容 一 一 前 面 版 本 中 ， 第 7 章 讲述 的 语言 翻译 原理 假设 学 生 没 有 
面 问 对 象 知识 。 本 版 假设 学 生 已 经 学 习 过 基本 的 面向 对 象 设 计 原 理 ， 展 示 的 语法 分 
析 程 序 使 用 了 对 象 组 合 、 继 承 和 多 态 调度 以 及 UML 图 。 

新 的 项 目 问 题 一 一 这 一 版 本 有 两 个 项 目 问 题 ， 一 个 是 新 的 ， 在 第 6 章 中 ， 要 求 写 一 
个 Pep/8 机 器 模拟 器 ; 另 一 个 是 改进 的 ， 在 第 7 章 中 ， 要 求 写 一 个 Pep/8 汇编 器 。 这 
两 个 项 目 要 求 开 发 上 千 行 代码 的 程序 ， 它 们 都 有 多 个 部 分 ， 每 一 个 都 往 应 用 程序 中 
增加 了 更 多 的 功能 。 项 目的 目的 有 两 个 : 1) 让 学 生 获得 编写 较 复 杂 程 序 的 经 验 ; 
2 ) 增强 对 这 门 课程 问题 域 中 计算 机 系统 概念 的 理解 。 

改进 了 RAID 的 内 容 一 一 这 个 版 本 介绍 了 更 广泛 的 RAID 磁盘 系统 内 容 ， 扩 展 了 
RAID 等 级 01 和 10 的 区 别 ， 增 加 了 新 的 图 和 新 的 量化 分 析 习 题 。 

改进 了 MIPS 的 内 容 一 一 扩展 了 MIPS 的 内 容 ， 更 系统 地 比较 了 CISC 架构 的 Pep/8 和 
RISC JHJ MIPS。 新 的 MIPS 章节 用 新 的 指令 集 表 描 述 了 5 种 寻 址 方式 。MIPS 机 器 
的 数据 区 的 图 包括 了 伪 直 接 寻 址 方式 所 要 求 的 数据 通路 和 复 用 器 。 明 确 命 名 的 控制 信 
号 使 用 与 Pep/8 控制 信号 相同 的 语法 ， 提 供 了 MIPS 指令 实现 更 简洁 而 详细 的 描述 。 





独特 的 特性 
本 书 有 几 个 独特 的 特性 ， 使 之 有 别 于 其 他 计算 机 系统 、 汇 编 语 言 和 计算 机 组 成 的 书 。 
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e 概念 的 方法 一 一 许多 教科 书 试图 跟 上 领域 的 变化 ， 包 括 最 新 的 技术 发 展 。 例 如 ， 最 
新 外 围 设备 的 通信 协议 规范 。 这 类 书 通 常 通 篇 是 “设备 如 何 工 作 ” 的 描述 性 解释 。 
本 书 避 开 了 这 类 资料 ， 而 只 选择 基础 的 计算 概念 ， 掌 握 了 这 些 就 有 了 理解 当前 和 未 
来 技术 的 基础 。 例 如 ， 以 数字 电路 设计 问题 来 说 ， 让 学 生 掌 握 空 间 /时 间 折 中 的 概念 
比 简 单 地 阅读 通用 描述 更 重要 。 再 举 一 个 例子 ， 通 过 学 习 如 何在 ISA 指令 的 微 代 码 
实现 中 合并 周期 来 掌握 硬件 并 行 的 概念 ， 这 样 才 是 最 好 的 。 
强调 问题 解决 一 一 如 果 只 听 说 或 者 读 到 某 个 主题 ， 学 生 能 记 住 的 很 少 ; 但 当 他 们 体 
验 到 时 ， 才 会 记 住 很 多 。 本 书 强调 问题 解决 ， 每 草 后 面 有 近 400 道 练习 ， 其 中 很 多 
有 多 个 部 分 。 这 些 练习 不 会 让 学 生 重 复课 本 中 的 原 话 ， 而 是 要 求 量化 地 解答 、 分 析 
或 者 设计 系统 某 个 抽象 层次 上 的 一 个 程序 或 电子 电路 。 
一 致 的 机 器 模型 一 一 Pep/8 机 器 是 一 个 小 型 的 CISC 计算 机 ， 是 描述 系统 所 有 层次 
的 载体 。 学 生 可 以 清晰 地 看 到 抽象 层次 之 间 的 关系 ， 因 为 他 们 要 在 所 有 的 层次 上 为 
这 个 机 器 编程 或 者 设计 电子 电路 。 例 如 ， 当 在 LG) 层 设 计 ALU 组 件 时 ， 他 们 知道 
ALU 在 ISA3 层 的 实现 中 应 该 在 哪个 位 置 。 通 过 像 编 译 器 那样 把 C++ 程序 翻译 成 汇 
编 语 言 ， 他 们 学 到 优化 编译 器 和 非 优化 编译 器 之 间 的 差别 。 在 不 同 层 次 上 都 使 用 同 
样 的 机 器 模型 做 工作 在 效率 上 有 很 大 的 优势 ， 因 为 模型 从 上 至 下 都 是 一 致 的 。 不 过 
本 书 也 讲述 了 MIPS 机 器 ,对比 了 RISC 设计 原理 和 微 程序 设计 的 CISC 设计 。 
© 完整 的 程序 示例 一 一 许多 计算 机 组 成 和 汇编 语言 的 书 会 受到 代码 片段 综合 征 的 影响 。 
Pep/8 的 内 存 模型 、 寻 址 方式 和 输入 /输出 特性 使 得 学 生 能 写 出 完整 的 程序 ， 容 易 执 
行 和 测试 ， 而 不 只 是 代码 片段 。 真 实 的 机 器 ， 特 别 是 RISC 机 器 ， 有 复杂 的 函数 调用 
协议 ， 涉 及 寄存 器 分 配 、 寄 存 器 溢出 和 内 存 对 齐 限 制 之 类 的 问题 。Pep/8 是 少数 几 种 
教学 机 之 一 (有 可 能 是 唯一 一 个 )， 人 允许 学 生 书 写 具 有 输入 /输出 的 完整 程序 ， 可 以 
使 用 全 局 变量 和 局 部 变量 、 全 局 数组 和 局 部 数组 、 传 值 调用 和 传 引用 调用 、 数 组 参 
数 、 使 用 转移 表 的 开关 语句 、 递 归 、 使 用 指针 的 链 式 结构 和 堆 。 写 完整 程序 的 作业 
进一步 实现 了 通过 动手 来 学 习 的 目标 ， 而 不 是 通过 读 代码 片段 来 学 习 。 
理论 和 实践 的 结合 一 一 有 些 读者 注意 到 了 ， 讲 述 语言 翻译 原理 的 第 7 章 在 计算 机 系 
统 书 中 不 常见 。 这 种 现象 可 斐 地 说 明了 计算 机 科学 课程 体系 甚至 计算 机 科学 领域 中 
理论 和 实践 之 间 的 鸿沟 。 因 为 本 书 讲述 了 HOL6 层 的 C++ 语言 、Asmbs 层 的 汇编 语 
言 和 ISA3 层 的 机 器 语言 ， 而 且 都 有 一 个 目标 ， 即 理解 层次 之 间 的 关系 ， 一 个 更 好 的 
问题 是 :“ 为 什么 不 能 包括 讲述 语言 翻译 原理 的 一 章 呢 ? ”本 书 尽 可 能 地 加 入 理论 以 
支持 实践 。 例 如 ， 介绍 布尔 代数 作为 一 个 公理 系统 ， 配 合 练习 来 证 明定 理 。 
宽度 和 深度 一 一 第 1 ~ 6 章 中 的 内 容 对 计算 机 系统 或 汇编 语言 编程 的 书 来 说 是 很 典 
型 的 , 第 8 ~ 12 章 对 计算 机 组 成 的 书 来 说 是 很 典型 的 。 在 一 本 书 中 包括 这 么 广泛 的 
内 容 是 很 独特 的 ， 而 且 它 还 在 一 个 完整 机 器 的 各 个 抽象 层次 上 使 用 一 个 一 致 的 机 占 
模型 。 数 字 电 路 LG 层 内 容 的 深度 也 是 很 特别 的 ， 它 使 得 CPU 的 组 成 部 分 不 再 神 
秘 。 例 如 ， 本 书 描述 了 Pep/8 CPU 的 复 用 器 、 加 法 器 、ALU、 寄 存 器 、 内 存 子 系统 
和 双向 总 线 的 实现 。 学 生 学 习 逻 辑 门 层 的 实现 ， 没 有 概念 上 的 空洞 ， 而 如 果 只 是 泛 
泛 地 描述 ， 就 只 能 选择 相信 而 不 能 完全 理解 。 

本 书 回 答 了 这 个 问题 “汇编 语言 编程 和 计算 机 组 成 在 计算 机 科学 课程 体系 中 的 位 置 是 
什么 ?” 它 提供 了 对 无 处 不 在 的 汉 : 诺 依 曼 机 器 架构 的 深入 理解 。 本 书 的 目标 是 提供 本 领域 
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内 所 有 主要 知识 域 的 综合 概述 ， 包 括 软 件 和 硬件 的 结合 ， 理 论 和 实践 的 结合 。 


计算 机 课程 体系 2001 


ACM 和 IEEE 计算 机 学 会 建立 了 计算 机 科学 的 “课程 体系 2001” 指 导 原 则 。 该 指 
导 原 则 给 出 了 知识 体 的 分 类 和 具体 核心 。 本 书 适用 于 体系 结构 和 组 成 ( Architecture and 
Organization，AR) 类 别 ， 几 乎 包含 AR 知识 体 中 所 有 的 核心 主题 。 初 期 报告 中 的 AR 核心 
域 以 及 本 书 中 覆盖 这 些 域 的 章节 如 下 所 示 : 

AR1. 数字 逻辑 和 电子 系统 ,第 10、11、12 章 。 

AR2. 数据 的 机 器 级 表示 ,第 3 章 。 

AR3. 汇编 层 机 器 组 成 , 第 4、5、6 章 。 

AR4. 内 存 系统 组 成 和 体系 结构 ， 第 9、11 章 。 

ARS. 接口 与 通信 , 第 8、9 章 。 

AR6. 功能 组 成 ,第 11、12 章 。 

AR7. 多 处 理 和 其 他 体系 结构 ， 第 8 章 。 


致谢 

Pep/1 有 16 条 指令 、 一 个 累加 侨 和 一 种 寻 址 方式 。Pep/2 增加 了 变 址 寻 址 。John Vannoy 
HH ALGOL W 语言 写 了 2 个 模拟 器 。Pep/3 A 32 条 指令 ， 用 Pascal 语 言 编 写 ， 是 学 生 软 
件 项 目 ， 由 Steve Dimse、Russ Hughes、Kazuo Ishikawa、Nancy Brunet 和 Yvonne Smith 完 
成 。Harold Stone 在 早期 审阅 中 提出 许多 对 Pep/3 架构 的 改进 意见 ， 后 来 被 加 到 Pep/4 中 ， 
并 延续 到 后 续 的 机 器 中 。Pep/4 有 特殊 的 栈 指 令 ， 模 拟 ROM 和 软件 陷阱 。Pep/5 有 更 正 交 
的 设计 ， 人 允许 任何 指令 使 用 任何 寻 址 方式 。John Rooker 写 了 Pep/4 系统 和 早期 的 Pep/5 版 
本 。Gerry St. Romain 实现 了 一 个 MacOS 版 本 和 一 个 MS-DOS 版 本 。Pep/6 简化 了 变 址 寻 址 
方式 ， 也 包括 了 一 组 完整 的 条 件 分 支 指令 。John Webb 用 BlackBox 开发 系统 编写 了 跟踪 功 
能 。Pep/7 把 安装 的 内 存 从 4 MB 增加 到 了 32 MB。Pep/8 把 寻 址 方式 的 数量 从 4 增加 到 8, 
安装 的 内 存 增加 到 64MB。Pep/8 汇编 右 和 模拟 器 的 GUI 版 本 由 一 组 学 生 用 Qt 开发 系统 和 
C++ 实现 和 维护 ， 小 组 成 员 包 括 Deacon Bradley, Jeff Cook, Nathan Counts, Stuartt Fox, 
Dave Grue, Justin Haight, Paul Harvey. Hermi Heimgartner, Matt Highfield, Trent Kyono, 
Malcolm Lipscomb, Brady Lockhart, Adrian Lomas, Ryan Okelberry, Thomas Rampelberg, 
Mike Spandrio, Jack Thomason, Daniel Walton, Di Wang, Peter Warford 和 Matt Wells. 
Ryan Okelberry 也 参与 编写 了 Pep/8 CPU 模拟 器 。Luciano d’llori 编写 了 汇编 器 的 命令 行 
版 本 。 

Tanenbaum 的 《 Structured Computer Organization 》 比 其 他 任何 一 本 书 都 更 大 地 影响 了 
本 书 的 编写 。 本 书 扩展 了 Tanenbaum 书 的 层次 结构 ， 在 上 面 增加 了 高 级 语言 层 和 应 用 层 。 

下 面 这 些 书 稿 审阅 者 和 前 一 版 本 的 用 户 极 大 地 影响 了 本 版 本 的 终 稿 ， 他 们 是 : Wayne P. 
Bailey, Jim Bilitski, Fadi Deek, William Decker, Peter Drexel, Gerald S. Eisman、Victoria 
Evans, David Garnick, Ephraim P. Glinert、 Dave Hanscom, Michael Hennessy. Michael 
Johnson, Andrew Malton, Robert Martin, Richard H. Mercer, Randy Molmen, John Motil, 
Peter Ng. Bernard Nudel, Carolyn Oberlink, Wolfgang Pelz, James F. Peters III, James C. 


Pleasant, Eleanor Quinlan, Glenn A. Richard, David Rosser, Gerry St. Romain, Harold S. 


XII 


Stone, J. Peter Weston 和 Norman E. Wright, Joe Piasentin 提供 了 艺术 咨询 。 有 两 个 人 极 大 
地 影响 了 Pep/8 的 设计 ， 一 位 是 Myers Foreman， 有 关 指 令 集 的 很 多 想法 都 来 自 于 他 ; 另 一 
位 是 Douglas Harms， 他 提出 很 多 改进 意见 ， 其 中 之 一 是 MOVSPRA 指令 ， 使 得 可 以 用 传 引用 
方式 传递 局 部 变量 。 

Jones and Bartlett Publishers 的 责任 编辑 Tim Anderson, P m EE Amy Rose 和 编辑 助 
理 Melissa Potter 提供 了 宝贵 的 支持， 很 高 兴 与 他 们 一 起 工作 。Kristin Parker 设计 的 吸引 人 
的 封面 正 符 合 本 书 的 风格 。 

我 很 幸运 在 一 所 致力 于 在 本 科教 学 中 追求 里 越 的 学 校 。 佩 珀 代 因 〈 了 Pepperdine) 大 学 的 
Ken Perrin， 提 供 了 富有 创造 性 的 环境 和 专业 的 文 持 ， 正 是 在 这 种 环境 中 ， 本 书 得 到 孕育 。 
我 的 妻子 Ann 给 予 我 无 尽 的 文 持 ， 我 要 为 本 书 占 用 的 时 间 回 她 道歉 ， 并 送 上 我 由 衷 的 感谢 。 


Stan Warford 
Malibu, California 
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Computer Systems, Fourth Edition 


计算 机 系统 





计算 机 科学 的 基础 问题 是 : 什么 能 够 被 自动 化 ?就 像 工 业 单 命中 研制 出 的 机 器 使 得 手工 
劳作 自动 化 了 ， 计算机 实现 了 信息 处 理 的 自动 化 。 电 子 计算 机 是 在 20 世纪 40 年 代 研 发 出 来 
的 ， 设计 者 构建 计算 机 是 为 了 自动 求解 数学 问题 。 不 过 从 那 时 起 ,计算 机 就 被 运用 到 了 各 种 
问题 上 ， 例 如 金融 会 计 、 航 空 预 订 、 文 字 处 理 以 及 图 形 图 像 。 计 算 机 传播 如 此 迅猛 ， 几 乎 每 
天 都 有 新 的 计算 机 目 动 化 领域 出 现 。 

本 书 的 目的 是 展示 计算 机 是 如 何 自 动 信息 处 理 的 。 从 原则 上 来 说 ， 计 算 机 所 能 做 的 一 
切 ， 你 都 能 做 。 计 算 机 和 人 执行 任务 的 主要 区 别 在 于 计算 机 执行 任务 非常 迅速 。 不 过 要 利用 
它 的 速度 ， 人 们 必须 指导 计算 机 ， 也 就 是 对 计算 机 进行 编程 。 

要 想 理 解 计算 机 的 本 质 ， 最 好 的 方法 是 学 习 如 何 对 机 咒 编 程 。 编 写 程序 要 求学 习 编 程 
语言 。 在 投入 学 习 编 程 语言 的 细节 之 前 ， 本 章 首先 介绍 抽象 的 概念 (本 书 就 是 基于 抽象 这 
一 主题 )， 然 后 描述 计算 机 系统 的 硬件 和 软件 组 成 ， 最 后 描述 一 个 典型 应 用 一 一 一 个 数据 库 
系统 。 


1.1 抽象 层次 


抽象 层次 这 个 概念 在 艺术 以 及 自然 和 应 用 科学 中 都 广泛 存在 。 抽 象 的 完整 定义 是 多 面 
的 ， 对 我 们 要 讲述 的 领域 来 说 ， 包 括 下 面 这 样 一 些 部 分 : 

。 隐瞒 细节 以 展示 物质 的 本 质 。 

e 概要 结构 。 

o 通过 一 连 串 的 命令 划分 责任 。 

© 将 一 个 系统 细 分 成 较 小 的 子 系统 。 

本 书 的 主题 就 是 把 抽象 应 用 到 计算 机 科学 中 。 不 过 ， 我 们 先 从 考虑 其 他 一 些 非 计算 机 科 
学 领域 中 的 抽象 层次 开始 。 从 这 些 领域 中 得 出 的 类 比 会 扩展 到 上 述 抽象 定义 中 的 4 个 部 分 ， 
再 应 用 到 计算 机 系统 上 。 

抽象 层次 的 3 种 常见 图 形 化 表示 是 : (a) 层次 图 ; (b) RER; (c) 层次 结构 或 树 状 图 。 
现在 ， 我 们 分 析 每 种 抽象 的 表示 ， 说 明 它 们 是 如 何 类 比 的 。 这 三 张 图 也 适用 于 贯穿 本 书 的 计 
算 机 系统 中 的 抽象 层次 。 

层次 图 ， 如 图 1-1a 所 示 ， 是 一 组 垂直 排列 的 方 框 。 最 顶端 的 方 框 表 示 最 高 层次 的 抽象 ， 
最 底 端 的 方 框 表示 最 低层 次 的 抽象 。 抽 象 的 层 数 取决 于 所 描述 的 系统 。 这 张 图 表示 一 个 三 层 
HAN AZ. 

图 1-1b 是 岩 套 图 。 与 层次 图 一 样 ， 髓 套图 也 是 一 组 方 框 。 它 总 是 包括 一 个 大 的 外 层 方 
框 ， 其 余 的 方 框 都 供 套 在 里 面 。 在 这 张 图 中 ， 外 层 的 大 方 框 里 直接 藤 套 了 两 个 方 框 。 这 两 个 
方 框 中 ， 下 面 那个 里 面 还 肉 套 了 一 个 方 框 。 般 套图 中 最 外 层 的 方 框 对 应 于 层次 图 中 的 最 顶层 
方 框 。 衣 套 的 方 框 对 应 于 层次 图 中 较 低 层次 的 方 框 。 

在 姐 套 图 中 ， 方 框 是 不 重 亚 的 。 也 就 是 说 ， 和 藤 套图 中 绝 不 会 有 边界 互相 交叉 的 方 框 。 一 
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个 方 框 总 是 完全 包含 为 一 个 方 框 。 

抽象 层次 的 第 三 种 图 形 化 表示 是 层次 结构 或 树 状 图 ， 如 图 1-1c 所 示 。 在 树 中 ， 大 树枝 
从 树干 分 支出 来 较 小 的 树 校 从 较 大 的 树枝 中 分 支出 来 ， 以 此 类 推 。 树 叶 在 链 路 的 末端 ， 附 
FERNI E. K 1-1c 这 样 的 树 状 图 ， 主 干 在 项 端 而 不 是 底部 。 每 个 方 框 称 为 一 个 结 
点 ， 唯 一 的 顶端 结 点 称 为 根 。 没 有 更 低层 相连 的 结 点 是 叶子 。 图 1-1c 是 一 棵 有 着 一 个 根 结 
点 和 三 个 叶子 结 氮 的 树 。 层 次 结构 图 中 项 端的 结 点 对 应 于 层次 图 中 的 顶端 方 框 。 


| | 


E 


a) 层次 图 b) KERI c) 层次 结构 或 树 状 图 
图 1-1 三 种 抽象 层次 的 图 形 化 描述 


1.1.1 艺术 中 的 抽象 


FF). 马 蒂 斯 (Henri Matisse) 是 现代 艺术 史上 的 一 位 重要 人 物 。1909 年 ， 他 制作 了 一 
尊 女人 后 背 的 铜 雕 塑 ， 名 为 《 The Back I》。4 年 后 ， 他 又 创作 了 一 尊 同 样 主题 的 作品 ， 不 
过 用 了 更 简单 的 处 理 方 法 ， 并 将 此 作品 命名 为 《The Back I》。 又 过 了 4 年 ， 他 创作 了 《The 
Back III), 13 年 后 又 创作 了 《 The Back IV》。 图 1-2 展示 了 这 4 HMA, 





The Back I The Back Il The Back Ill The Back IV 
1909 1913 1917 1930 
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这 些 作品 的 一 个 显著 特征 是 ， 在 一 件 作 品 到 另 一 件 作 品 的 发 展 中 ， 艺 术 家 不 断 地 去 除 细 
节 。 第 二 尊 雕 塑 中 背部 轮廓 变 得 不 怎么 清晰 ， 第 三 尊 雕 塑 中 右手 手指 被 隐 去 ， 而 在 最 为 抽象 
的 第 四 尊 雕 塑 中 ， 几 乎 不 能 识别 出 臂 部 。 
马 蒂 斯 追求 表达 性 ， 他 故意 隐藏 视觉 上 的 细节 而 去 展示 主题 的 实质 。1908 年 他 写 道 9: 
在 一 幅 画 中 ， 每 个 可 见 的 部 分 都 扮演 着 赋予 它 的 角色 ， 无 论 是 主要 的 还 是 次 要 
的 。 务 中 所 有 那些 没 用 的 部 分 都 是 有 害 的 。 艺 术 作 品 必须 在 整体 上 是 和 谐 的 ， 因 为 


© Alfred H. Barr, Jr., Matisse: His Art and His Public (纽约 : 现代 艺术 博物 馆 ，1951 )。 
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在 观赏 者 脑海 中 ， 多 余 的 细节 会 侵占 主要 元 素 的 位 置 。 
隐藏 细节 是 抽象 层次 这 一 概念 的 必要 组 成 部 分 ， 它 直接 适用 于 计算 机 科学 。 在 计算 机 科 
学 术语 中 ,《 The Back IV 》 抽 象 层 次 最 高 ,《 The Back!) & 





次 最 低 。 图 1-3 的 层次 图 展示 了 这 些 层次 的 关系 。 Se 

就 像 艺术 家 一 样 ， 计 算 机 科学 家 必须 认识 到 要 素 和 细节 | The Back I | 
之 间 的 区 别 。 按 时 间 进 程 ， 马 蒂 斯 的 “The Back” 系 列 是 从 
最 注重 细节 演变 到 最 抽象 。 然 而 ， 在 计算 机 科学 中 ， 解 决 问 
题 的 进程 应 该 是 从 最 抽象 到 最 详细 。 本 书 的 目标 之 一 就 是 教 a EAEAN. 
你 如 何 进行 抽象 思维 ， 如 何在 对 一 个 问题 制定 解决 方案 时 忽略 aa 
无 关 的 细节 。 并 不 是 说 在 计算 机 科学 中 细节 不 重要 ! 细节 是 最 。 ” ”层次 最 高 


重要 的 。 不 过 在 计算 问题 中 ， 人 们 自然 倾向 于 在 开始 阶段 非常 
注重 很 多 细节 ; 而 在 计算 机 科学 中 解决 问题 时 ， 要 素 应 该 比 细节 优先 考虑 。 


1.1.2 文档 中 的 抽象 


在 概括 书面 文档 的 架构 时 ， 抽 象 层次 的 作用 也 是 显而易见 的 。 以 美国 宪法 为 例 ， 它 包括 
7 章 ， 每 章 又 分 为 多 节 。 下 面 的 大 纲 展示 了 条 款 和 章节 的 标题 ， 它 并 不 是 宪法 本 身 的 一 部 
分 9， 只 不 过 是 总 结 了 各 个 部 分 的 内 容 。 


第 一 条 ”立法 部 门 
第 一 款 ”国会 
BOK ”众议院 
第 三 款 ”参议 院 
BOK ”参议 员 和 众 议 员 的 选举 一 一 国会 会 议 
BLK ”国会 两 院 的 权利 与 职责 
BK ”参议 员 和 众 议 员 的 报酬 、 特 权 及 任职 限制 
Bem ”法 案 通 过 的 方式 
第 八 款 ”国会 权利 
第 九 款 ”对 联邦 权利 的 限制 
第 十 款 ”对 各 州 的 限制 
第 二 条 ”行政 部 门 
BK BS 
BOK . 总 统 的 职权 
第 三 款 总 统 的 责任 
SOK ”行政 和 文职 官员 的 免职 
第 三 条 ”司法 部 门 
第 一 款 ”联邦 法 院 的 司法 权 
第 二 款 ”联邦 法 院 的 管辖 范围 
第 三 款 TE 


oOo ”加利福尼亚 州 参议 员 J. A. Beak, 参议 院 秘 书 长 ,《 加 利 福 尼 亚 州 州 宪法 六 《美国 宪法 和 相关 文献 》( 萨 克 
拉 门 托 ，1967 ) 。 
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第 四 条 ”各 州 和 联邦 政府 
第 一 款 各州 的 官方 法 律 
第 二 款 EMBAR 
第 三 款 “ 新 的 州 
第 四 款 ”对 各 州 保护 的 保证 
第 五 条 ”修正 案 
第 六 条 ”总 体 保障 
第 七 条 ”宪法 的 批准 


宪法 作为 一 个 整体 是 最 高 层次 的 抽象 。 每 个 特定 的 条 款 ， 例 如 第 三 条 (司法 部 门 )， 处 
理 整体 的 一 部 分 。 这 一 条 的 某 一 款 ， 例 如 第 二 款 (联邦 法 院 的 管辖 范围 ) 讲述 一 个 特定 的 主 
题 ， 抽 象 层 次 最 低 。 这 个 大 纲 从 逻辑 上 对 这 些 主题 进行 组 织 。 

图 1-4 的 舱 套 图 展示 了 宪法 大 纲 的 结构 ， 外 层 的 大 方 框 代 表 整 个 宪法 ， 它 里 面 仍 套 的 7 个 
\\— RAITT HERR “AR”, BE “AR” FRIST HENNE “RR” © 

这 种 对 文档 组 织 列 大 纲 的 方法 在 计算 机 科学 中 也 是 很 重要 的 。 按 照 大纲 格 式 组 织 程序 和 
信息 的 技术 称 为 结构 化 程序 设计 (structured programming)。 这 和 语文 作文 老师 教 你 在 写作 
细节 之 前 先 按照 大 纲 的 格式 组 织 好 报告 是 一 样 的 道理 ， 软 件 设计 者 先 组 织 好 程序 大 纲 ， 再 填 
写 编 程 细节 。 


1.1.3 ”组织 中 的 抽象 


公司 组 织 是 男 一 个 用 到 抽象 层次 概念 的 领域 。 例 如 ， 图 1-5 是 一 个 假想 的 教材 出 版 公司 
以 层次 结构 图 表示 的 部 分 组 织 结构 。 公 司 总 裁 在 最 高 的 层次 ， 对 整个 公司 的 成 功 运营 负责 。 
4 个 副 总 裁 向 总 裁 汇 报 ， 每 个 副 总 裁 只 负责 一 个 主要 的 运营 部 门 。 在 每 个 经 理 和 副 总 裁 下 面 
还 有 更 多 的 层次 ， 本 图 中 没有 展示 出 来 。 


副 总 裁 副 总 裁 副 总 裁 副 总 裁 
大 学 部 高 中 部 小 学 部 专业 图 书 
kuen || mwan | mma 
销售 经 理 销售 经 理 销售 经 理 
图 


图 1-4 美国 宪法 的 藤 套 图 图 1-5 一 个 假想 的 出 版 公司 的 简化 组 织 
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组 织 结构 图 中 的 层级 对 应 组 织 中 相应 的 责任 和 权力 。 总 裁 代 表 整 个 公司 的 利益 ， 给 
那些 向 她 汇报 的 人 授予 相应 的 责任 和 权力 。 那 些 人 再 
运用 他 们 的 权力 去 管理 组 织 中 其 负责 的 部 门 ， 还 可 以 
向 员工 授予 相应 的 责任 。 在 企业 中 ， 每 个 人 拥有 的 实 
际 权力 可 能 并 不 能 由 他 们 在 官方 结构 图 中 的 位 置 直接 
反映 。 而 在 其 他 的 一 些 组 织 中 ,例如 美国 军队 ， 有 
严格 的 命令 链 。 图 1-6 是 一 个 层次 图 ， 它 展示 了 美军 
中 的 权力 线 ， 以 及 每 个 军官 要 对 哪个 单位 负责 。 

类 比 组 织 结 构图 反映 组 织 结 构 功 能 ， 计 算 机 系统 
功能 也 可 以 按照 类 似 的 关系 图 反映 出 来 。 就 像 一 个 大 的 
组 织 ， 一 个 大 的 计算 机 系统 一 般 是 按照 层次 结构 来 组 织 
的 。 计 算 机 系统 中 任何 一 部 分 都 接收 来 自 层次 结构 图 中 
它 的 直接 上 级 的 命令 。 然 后 ， 它 把 需要 执行 的 指令 分 发 


四 星 上 将 ”陆军 





给 层次 结构 中 它 的 直接 下 级 。 图 1-6 美国 军队 中 的 命令 链 。 四 星 上 
将 位 于 抽象 的 最 高 层 
1.1.4 ”机 器 中 的 抽象 (来 源 : Henry Mintzberg,《 The Structuring 


另 一 个 抽象 层次 的 例子 是 和 计算 机 系统 非常 类 似 的 。 ena nena ne 
汽车 。 与 计算 机 系统 一 样 ， 汽 车 是 一 全 人造 机 锋 。 它 由 wood Cliffs, NJ.) 许可 进行 了 修改 ) 
发 动机 、 变 速 器 、 电 气 系统 、 制 冷 系 统 和 底盘 组 成 ， 每 
部 分 被 进一步 细 分 ， 其 中 电气 系统 包括 电池 、 前 照 灯 、 稳 压 器 以 及 其 他 一 些 部 件 。 

和 汽车 相关 的 人 位 于 不 同 的 抽象 层次 。 驾 驶 者 位 于 最 高 的 抽象 层次 ， 驾 驶 者 了 解 怎 样 各 
驶 汽车 ， 例 如 ， 怎 样 启 动 ， 怎 样 加 速 ， 怎 样 条 车 。 

抽象 的 下 一 层次 是 初级 机 械 师 。 与 一 般 的 司机 相 比 , 他 们 知道 更 多 发 动机 盖 下 面 的 细 
节 ， 知 道 怎么 换 机 油 和 火花 塞 ， 但 他 们 不 需要 知道 有 关 开 汽车 的 细节 知识 。 

抽象 的 再 下 一 层次 是 高 级 机 械 师 ， 他 们 可 以 完全 地 拆 外 发 动机 ， 拆 解 、 修 理 并 把 它 再 组 
装 到 一 起 。 如 果 只 是 简单 地 更 换 机 油 并 不 需要 知道 这 些 细节 知识 。 

同样 的 道理 ， 与 计算 机 相关 的 人 也 位 于 不 同 的 抽象 层次 ， 使 用 计算 机 不 需要 完全 介 得 计 
算 机 的 每 个 抽象 层次 。 你 不 需要 成 为 机 械 师 才能 开车 。 同 样 ， 如 果 只 想 使 用 文字 处 理 软件 ， 
你 不 需要 成 为 经 验 丰 富 的 程序 员 。 


1.1.5 计算 机 系统 中 的 抽象 


图 1-7 展示 了 一 个 典型 的 计算 机 系统 的 层次 结构 。 图 中 的 每 一 层 都 有 它 自 己 的 语言 : 
第 7 层 (App7 ): 与 应 用 程序 有 关 的 语言 

第 6 层 (HOL6): 与 机 需 无 关 的 编程 语言 

第 5 层 (Asmb5 ): 汇编 语言 

第 4 层 (OS4 ): 操作 系统 调用 

第 3 E (ISA3 ): 机 器 语言 

第 2 JZ (Mc2 ): 微 指 令 和 寄存 器 传输 

第 1 层 (LG1): 布尔 代数 和 真 值 表 

用 这 些 语言 编写 的 程序 指示 计算 机 执行 一 定 的 操作 。 一 个 执行 特定 任务 的 程序 可 以 用 
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图 1-7 中 的 任 一 层次 的 语言 编写 。 与 汽车 一 样 ， 一 个 用 某 一 层 语 言 写 程序 的 人 人， 不必 懂得 任 
何 更 低层 的 语言 。 
当 发 明 计算 机 时 ， 只 有 LG1 和 ISA3 这 两 层 。 


人 们 要 想 与 这 些 机 器 通信 ， 就 必须 在 指令 集 架 构 
层 上 用 机 器 语言 (machine language) 对 它们 编程 。 5 
机 融 语 言 对 于 机 器 来 说 很 好 ， 但 是 对 于 人 类 程序 4 


员 来 说 单调 乏味 而 且 很 不 方便 。 于 是 AsmbS 层 的 
汇编 语言 (assembly language) 应 运 而 生 ， 以 便 帮 
助人 类 程序 员 。 5 

最 早 的 计算 机 巨大 且 昂 贵 。 当 一 个 程序 员 占 1 
用 计算 机 时 ， 其 他 的 用 户 就 必须 排队 等 候 ， 这 浪 i 2 
ATARAR. EE A T os A ARIST KAIN. 
的 操作 系统 (operating system)， 这 样 许多 用 户 可 
以 同时 接 入 计算 机 。 对 于 今天 的 个 人 计算 机 来 说 ， 即 使 只 服务 一 个 用 户 ， 操 作 系 统 仍然 是 管 
理 程 序 和 数据 所 必需 的 。 

早期 ， 每 次 当 一 家 公司 介绍 一 款 新 发 布 的 计算 机 模型 时 ， 程 序 员 就 不 得 不 学 习 那 个 模 
型 的 汇编 语言 。 他 们 为 旧 机 器 所 写 的 所 有 程序 都 不 能 在 新 机 器 上 使 用 。 于 是 ， 人 们 发 明了 
HOL6 层 的 高 级 语言 (high-order language)， 这 样 程序 可 以 不 怎么 改动 就 从 一 种 计算 机 转移 
到 另 一 种 计算 机 上 ， 而 且 用 高 级 语言 编程 比 用 低级 语言 编程 容易 。 你 可 能 熟悉 下 面 这 些 流行 
的 HOL6 层 的 语言 。 

e FORTRAN 公式 转换 项 (FORmula TRANSslator ) 。 





e BASIC 初学 者 的 通用 符号 指令 代码 (Beginner’s All-purpose Symbolic Instr- 
uction Code ) 。 

e LISP 列表 处 理 。 

® C++ 流行 的 通用 语言 。 

e Java 适合 于 万 维 网 浏览 句 。 


计算 机 系统 的 广泛 使 用 促使 人 们 开发 出 了 许多 App7 层 的 应 用 程序 。 编 写 应 用 程序 
(application program) 是 为 了 解决 特定 类 型 的 问题 ， 比 如 打印 工资 支票 、 输 入 文档 或 者 统 
计 分 析 数 据 。 这 使 得 你 可 以 把 计算 机 当 作 工具 来 使 用 而 无 需 知 道 更 低层 上 的 操作 细节 。 

最 底层 LG] 由 称 作 逻辑 门 (logic gate) 的 电子 组 件 组 成 。 在 向 更 高 层 发 展 的 过 程 中 ， 人 
们 发 现在 逻辑 门 层 上 设置 一 个 新 的 层次 是 非常 有 用 的 ， 它 能 够 帮助 设计 者 构建 ISA3 层 的 机 
器 。 在 现在 的 一 些 计算 机 系统 中 ,使 用 Mc2 层 的 微 程序 设计 ( microprogramming) 来 实现 
ISA3 层 的 机 船 。Mc2 层 是 发 明 手 持 式 计算 硕 的 一 种 重要 工具 。 

学 习 本 书 的 目的 是 与 计算 机 进行 有 效 的 沟通 。 为 了 实现 这 个 目标 ， 你 必须 学 习 计 算 机 语 
言 。 较 高 层 的 语言 比 低层 的 语言 更 人 性 化 ， 更 易于 理解 ， 这 也 正 是 人 们 发 明 它 们 的 原因 。 

大 多 数 人 最 开始 都 是 通过 使 用 别人 写 的 程序 来 学 习 App7 层 的 计算 机 。 准 备 输 入 公司 工 
资 单程 序 的 办 公 人 员 ， 还 有 游戏 玩家 ， 都 属于 这 一 类 。 在 用 户 手册 中 ,通常 有 关于 App7 Je 
的 应 用 程序 说 明 ， 描 述 应 该 怎样 运行 某 个 特定 的 程序 。 

在 学 习 本 书 时 ， 你 会 通过 不 断 审 视 较 低层 的 抽象 来 了 解 计算 机 系统 内 部 的 工作 原理 。 进 
入 的 层 越 低 ， 你 就 会 发 现 越 多 的 在 更 高 层 中 被 隐藏 的 细节 。 在 不 断 学 习 的 过 程 中 ， 你 要 牢 
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记 图 1-7, PRETEEN BE: 计算 机 科学 的 美 不 在 于 细节 的 多 
样 ， 而 在 于 概念 的 统一 。 


1.2 硬件 


我 们 构建 计算 机 是 为 了 解决 问题 。 早 期 的 计算 机 主要 解决 数学 和 工程 问题 ， 后 来 的 计 
算 机 强调 商业 应 用 的 信息 处 理 ， 今 天 ， 计 算 机 也 控制 各 种 诸如 汽车 发 动机 、 机 器 人 和 微波 炉 


之 类 的 机 器 。 计 算 机 系统 通过 接收 输入 、 处 理 输入 并 生成 a) an] 
给 出 来 解决 这 些 领域 的 问题 。 图 1.8 说 明了 计算 机 系统 的 ~ TDP 


功能 。 图 1-8 计算 机 系统 的 3 个 活动 
计算 机 系统 由 硬件 和 软件 组 成 。 硬 件 (hardware) 是 系统 的 物理 组 成 部 分 ,一 旦 设计 好 ， 
更 改 它 会 很 困难 且 昂 贵 。 软 件 (software) 是 一 组 程序 ， 它 指示 硬件 进行 工作 ， 比 硬件 容易 
修改 。 与 只 能 解决 一 种 问题 的 专用 机 器 相 比 ， 计 算 机 的 价值 在 于 它 是 可 以 解决 许多 不 同 问题 
的 通用 机 器 。 通 过 给 系统 提供 不 同 的 指示 ， 即 不 同 的 软件 ， 用 相同 的 硬件 可 以 解决 不 同 的 
10] 问题 。 
每 台 计 算 机 有 4 个 基本 的 硬件 组 件 : 
e 输入 设备 。 
e 输出 设备 。 
e 主 存储 器 。 
e 中 央 处 理 单元 (CPU )。 
图 1-9 以 框图 的 形式 展示 了 这 些 组 件 。 方 框 之 间 的 
线 代 表 信 息 流 。 总 线 是 一 组 连接 组 件 的 线路 ， 信 息 通 过 
总 线 ( bus) 从 一 个 组 件 流 回 另 一 个 组 件 。 处 理 过 程 是 在 
CPU 和 主 存储 器 (简称 主 存 ) 中 进行 的 。 图 1-9 中 的 各 
个 组 件 通过 总 线 互 连 的 结构 是 常见 的 ， 但 是 也 有 其 他 可 图 1-9 计算 机 系统 4 个 组 件 的 方 框图 
能 的 结构 。 
通常 根据 计算 机 硬件 的 相对 物理 大 小 对 其 进行 分 类 : 
e 小 个 人 计算 机 。 
e 中 工作 站 。 
e 大 大 型 主机 。 
对 于 大 型 主机 ， 仅 仅 CPU 就 能 占据 一 个 整个 的 机 柜 ， 它 的 输入 /输出 (1O) 设备 和 存 
储 器 可 能 会 填 满 一 个 房间 。 个 人 计算 机 可 以 小 到 放 在 桌子 上 或 者 公文 包 里 。 随 着 技术 的 发 
展 ， 过 去 可 能 只 能 在 大 型 计算 机 上 做 的 处 理 变 得 可 能 在 更 小 的 计算 机 上 进行 了 。 现 在 ， 个 人 
计算 机 可 以 做 很 多 过 去 只 有 工作 站 或 大 型 主机 才能 做 的 工作 。 
上 述 分 类 是 基于 计算 机 的 物理 大 小 ， 而 不 是 存储 器 大 小 。 计 算 机 系统 用 户 通常 更 关心 存 
储 器 的 大 小 ， 因 为 它 是 一 个 更 直观 的 指标 ， 指 明 硬 件 可 以 执行 的 有 效 工 作 量 。 计 算 速率 是 另 
一 个 对 用 户 来 说 很 重要 的 特性 。 一 般 来 说 ， 用 户 希 望 他 的 计算 机 CPU 运算 速率 快 并 且 存 储 
容量 大 ， 而 输入 /输出 设备 和 主 存 占 用 的 物理 空间 又 要 小 。 
因此 ， 当 计算 机 科学 家 研究 问题 时 ， 他 们 关心 的 是 空间 和 时 间 一 一 计算 机 系统 内 存储 问 
题 所 需 的 空间 和 解决 问题 所 需 的 时 间 。 他 们 通常 用 如 图 1-10a 所 示 的 公制 前 级 来 表示 空间 或 
LU 时 间 的 大 小 数量 。 





HIF HAMAR 9 






C | = 1105 999 906 ea 
Pee rna 


a) 表示 10 的 寡 的 前 绥 b) 表示 较 大 数 的 前 级 在 计算 机 科学 中 的 数值 





图 1-10 科学 表示 法 中 的 前 级 


例 1.1 在 图 1-9 中 ,假设 通过 总 线 从 一 个 组 件 传 送 一 些 信息 到 男 外 一 个 组 件 需 要 4.5 微 
秒 (us), (a) 该 传送 需要 多 少 秒 ? (b) 1 分 钟 内 能 发 生 多 少 次 传送 ? 

(a) 从 图 1-10a 可 知 ， 时 间 4.5 微 秒 是 4.5X 10° MH 0.000 004 5 秒 。(b) 因为 1 分 钟 等 
于 60 秒 ， 所 以 1 分 钟 内 可 发 生 的 传送 次 数 是 ( 60 秒 ) / (0.000 004 5 秒 / 传 送 )， 即 13 300 000 次 
传送 。 注 意 ， 由 于 题目 给 出 的 原始 数据 是 2 位 有 效 数字 ， 所 以 结果 的 有 效 数字 不 能 超过 2 位 或 
3 位 。 o 

图 1-10a 说 明 在 公制 系统 中 ， 前 级 kilo- 表示 1000, mega- 表示 1 000 000。 但 是 ， 在 计 
算 机 科学 中 ，kilo- 表示 2" 或 者 1024。1000 tk 1024 小 不 到 3%， 因 此 你 可 以 把 计算 机 科学 
中 的 kilo- 理解 为 1000， 尽管 它 稍微 大 一 点 。 这 种 方式 同样 适用 于 mega- 和 giga-, ， 如 
图 1-10b 所 示 。 这 时 ， 近 似 值 的 偏差 更 大 一 些 , 但 是 对 于 mega-， 偏 差 仍 在 5% WA. KH 
这 些 看 起 来 奇怪 的 惯例 与 在 指令 集 架 构 层 (ISA3 层 ) 的 信息 表示 有 关 。 


1.2.1 输入 设备 


输入 设备 (input device) 把 从 外 部 世界 来 的 信息 传送 到 计算 机 的 存储 器 。 图 1-11 展示 了 
”数据 通过 总 线 从 输入 设备 到 存储 器 的 路 径 。 输 入 设备 的 类 型 有 很 多 种 ， 包 括 : 

e 键盘 。 

© REIKI RE o 

© USB IAFF aka ti. 

e 鼠标 设备 。 

© AGH. 

当 在 键盘 上 敲 击 一 个 键 时 ， 你 将 一 个 字符 发 送 到 主 存 ， 这 个 字符 以 8 位 电子 信号 序列 的 
形式 存储 在 存储 器 中 。 序 列 中 的 每 一 位 信号 称 为 一 个 二 进 制 数 字 (binary digit) (或 者 比特 ， 
bit (有 时 也 译作 “位 ”))。 这 个 信号 可 以 是 高 电压 ， 用 符号 1 表示 ， 或 是 低 电 压 ， 用 符号 0 
表示 。8 位 信号 序列 组 成 的 字符 叫 作 1 F (byte), WK 1-12 所 示 。 

办 公 室 文员 在 一 台 计 算 机 键盘 上 进行 输入 是 在 应 用 层 (App7 层 )， 这 是 计算 机 系统 结构 
中 的 最 高 抽象 层次 。 他 们 不 需要 知道 他 们 输入 的 每 字符 的 位 模式 (bit pattern). Mi ARR 
构 层 (ISA3 JZ) 的 程序 员 必 须知 道 位 模式 。 现 在 ， 你 应 该 记 住 数 据 的 一 个 字 市 对 应 键盘 的 
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一 个 字符 。 
cu] [ten 
See. Cl 
| a) —*4 Z JR 
i er ) 一 个 8 比特 字 节 的 存储 表示 
CPU 中 央 处 理 单 元 
Mem 主 存储 器 ofrfrfofrfofafr 
Out 输出 设备 b) 字符 “k ”的 位 模式 
图 1-11 输入 的 数据 通路 。 信 息 通过 总 线 图 1-12 1 字 节 的 信息 。 当 在 键盘 上 按 下 “kk 
从 输入 设备 流 到 主 存储 器 时 ， 信 和 号 01101011 会 传送 到 总 线 上 ， 


然后 存储 到 主 存储 右上 


例 1.2 一 个 打字 员 以 每 分 钟 35 个 单词 的 速度 在 一 台 计 算 机 键盘 上 输入 文本 。 如 果 平 
均 每 个 单词 的 长 度 是 7 个 字符 ， 那 么 每 秒 有 多 少 比特 被 传送 到 主 存 呢 ? 一 个 空格 键 是 一 个 字 
符 ， 假 设 平均 每 个 单词 后 有 一 个 空格 。 

包括 空格 ， 每 个 单词 是 8 个 字符 ， 每 秒 输入 的 字符 数 等 于 (35 单词 /分 钟 ) X (8 字符 / 
单词 ) X〈1 分 钟 /60 秒 ) = 4.67 字符 / 秒 。 因 为 一 个 字 节 存储 一 个 字符 ， 一 个 字 节 包含 8 比特 ， 
所 以 比特 率 是 〈4.67 字符 / 秒 ) X〈1 字 节 / 字 符 ) X (8 比特 / 字 节 ) = 37.4 比特 / 秒 。 口 

字 节 的 缩写 是 大 写字 母 B， 比 特 的 缩写 是 小 写字 母 b。 因 此 ， 例 1.2 中 的 结果 可 以 写作 
37.4 b/s， 再 举 一 个 例子 ， 你 可 以 把 12 000 字 节 写作 12 KB. 

磁盘 驱动 器 ( disk drive) 是 计算 机 的 一 部 分 ， 我们 从 磁盘 提取 数据 或 者 把 数据 写 到 磁盘 
上 。 磁 盘 驱 动 需 包 括 一 个 使 磁盘 旋转 的 发 动机 ， 一 个 轴 或 轮 载 夹 用 于 把 磁盘 固定 在 发 动机 
上 ， 一 个 或 多 个 用 来 探测 磁盘 表面 单个 比特 的 读 / 写 头 。 

便 盘 被 永久 固定 密封 在 磁盘 驱动 器 中 。 通 常 ， 个 人 计算 机 的 存储 容量 为 230 GB ~ 1 TB 
之 间 ， 工 作 站 的 存储 容量 为 1T 一 100 TB， 大 型 主机 的 容量 大 于 100 TB。 硬 盘 驱 动 器 通过 
在 一 个 轴 上 堆肥 数 个 盘 片 的 方式 来 实现 高 容量 ， 每 个 磁盘 表面 有 一 个 专门 的 读 / 写 头 。 

光盘 最 初 是 作为 音频 压缩 盘 流 行 起 来 的 ， 不 过 很 快 就 用 于 为 计算 机 存储 数据 。 光 盘 的 记 
录 技 术 是 基于 激光 的 ， 激 光 可 以 形成 高 度 聚 焦 的 单 色 光束 。 光 盘 上 有 矢 人 式 的 纹理 ， 它 从 中 
心 螺 旋 状 地 盘 出 ， 上 面 有 激光 束 记 录 的 凹凸 序列 ， 每 个 止 或 者 凸 代 表 被 光束 反射 所 探测 到 的 
比特 信息 。 一 张 CD 的 典型 存储 容量 是 650 MB. DVD 当初 设计 用 来 存储 多 通道 伴音 的 视频 
言 息 ， 现 在 也 被 计算 机 工业 采用 ， 一 张 DVD 的 典型 存储 容量 是 4.7 GB. 

例 1.3 要 想 把 硬盘 上 20 GB 信息 传送 到 一 组 CD 上 ， 需 要 多 少 张 CD ? 

硬盘 上 确切 的 字 节 数 是 20X10 737 412 824， 每 片 CD 上 的 字 节 数 是 650X1 048 576。 
然而 ， 如 果 你 满足 于 近似 值 ， 你 可 以 估计 硬盘 上 是 20X10” 字 节 ， 每 片 CD Æ 650X10 F 
节 。 需 要 的 CD 数量 是 (20X10”) / (650X10s) = 313%. 口 

USB 闪存 驱动 器 (flash drive)， 也 称 为 拇指 驱动 器 ， 其 实 并 不 是 一 个 磁盘 驱动 禹 。 它 是 
一 个 没有 移动 部 件 的 固态 设备 ， 用 来 模仿 硬盘 驱动 器 的 行为 。 缩 写 USB 表示 通用 串 行 总 线 
( Universal Serial Bus)， 它 定义 了 许多 人 硬盘 驱动 器 和 计算 机 系统 之 间 的 连接 协议 。 当 你 把 一 
个 拇指 驱动 硕 择 在 计算 机 上 时 ， 对 计算 机 来 说 ， 它 就 好 像 一 个 人 硬盘 驱动 器 一 样 。 因 为 拇指 驱 
动 顺 没有 移动 部 件 ， 所 以 它 比 硬盘 驱动 器 要 耐用 ， 也 不 像 便 盘 驱 动 器 ,， 它 是 可 移动 的 ， 存 储 
容量 可 以 达到 大 约 16 GB。 


Kr (mouse) 是 一 种 非常 常用 的 手持 输入 设备 。 


1# 计算 机 系统 1 


光学 鼠标 内 部 是 一 个 小 的 发 光 二 极 管 ， 


它 向 下 在 桌面 或 者 鼠标 垫上 投射 光束 ， 光 反射 回 一 个 每 秒 采 样 1 500 KERA BEA 
一 个 数字 信和 号 处 理 器 ， 它 像 一 个 被 编程 为 只 处 理 一 个 任务 的 微小 计算 机 : 探测 桌面 或 者 鼠标 
垫 图 像 中 的 模式 ， 并 确定 从 上 次 采样 到 现在 它们 移动 了 多 远 。 鼠 标 中 的 这 个 处 理 右 从 模式 中 
计算 鼠标 的 方向 和 速度 ， 然 后 把 这 些 数据 发 送 到 个 人 计算 机 ， 计 算 机 再 在 显示 需 上 显示 光标 


图 像 。 


条 形 码 读 码 器 (bar code reader) 是 男 一 种 高 效 的 输入 设备 。 最 常见 的 条 形 码 也 许 就 是 超 
市 商品 上 的 通用 产品 代码 (Universal Product Code，UPC) ( 见 图 1-13 )。UPC 符号 中 的 每 个 
数字 有 7 个 垂直 的 数据 元 素 ， 每 个 数据 元 素 是 白色 或 者 黑色 。 和 条形码 读 码 器 中 的 光电 管 检 
测 明暗 区 域 并 把 它们 转换 为 比特 ， 白 色 元 素 被 读 为 0， 黑色 元 素 被 读 为 1。 图 1-14 展示 了 
图 1-13 中 UPC 符号 右 半 部 分 中 两 位 数字 的 比特 与 黑白 区 域 之 间 的 对 应 关系 。 


UPC/PURCHASE SEAL 
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图 1-13 一 包 麦 片上 的 UPC 符号 。 左 边 5 位 数字 标识 制 
造 商 ， 右 边 5 位 标识 产品 。 桂 格 (Quaker) 公司 的 
代码 是 30000, 100% 天 然 麦 片 的 代码 是 06700 


10001001110010 





图 1-14 桂 格 麦片 盒子 上 UPC 符号 的 
片段 。 视 觉 上 ， 相 邻 的 黑色 区 
域 组 看 上 去 就 像 粗 的 竖 条 


图 1-15 给 出 了 UPC 中 十 进 制 数值 和 二 进 制 数 值 之 间 的 对 应 关系 ， 左 半 部 分 和 右 半 部 分 
中 的 字符 代码 是 不 一 样 的 。 一 个 黑色 的 竖 条 是 由 1 一 4 个 相 邻 的 黑色 区 域 构成 ， 每 个 十 进 制 


数字 都 含有 两 个 黑 条 和 2 个 白色 的 空间 。 左 半 部 分 
的 字符 都 始 于 白条 终于 黑 条 ， 右 半 部 分 的 字符 都 始 
于 黑 条 终于 白色 空间 ; 每 个 左 半 部 分 的 字符 都 有 奇 
数 个 1， 而 每 个 右 半 部 分 的 字符 有 偶数 个 1。 

超市 的 收银 员 在 最 高 的 抽象 层次 工作 ， 他 们 不 
需要 知道 UPC 符号 的 细节 ， 只 知道 要 录 和 人 UPC FF 
号 ， 如 果 没 有 听 到 确认 的 “ 哗 ” 声 ， 那 就 是 发 生 了 
录 人 人 错误， 必须 重新 扫描 条 形 码 。 然 而 在 较 低层 次 
的 程序 员 必 须知 道 编码 的 细节 。 例 如 ， 他 们 的 程序 
必须 检测 左 半 部 分 每 个 字符 的 1 或 者 黑色 元 素 的 个 
数 ， 如 果 左 半 部 分 的 字符 1 的 个 数 是 偶数 ， 那 么 程 
序 就 不 能 发 布 确认 的 哗 声 。 


1.2.2 输出 设备 
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图 1-15 UPC 符号 中 十 进 制 数值 的 位 模式 


输出 设备 ( output device) 从 计算 机 的 存储 器 传送 信息 到 外 部 世界 。 图 1-16 展示 了 数据 从 
主 存 到 输出 设备 的 通路 。 输 出 时 ， 数 据 经 过 与 输入 设备 使 用 的 一 样 的 总 线 。 输 出 设备 包括 : 


© 磁盘 驱动 器 。 
© USB 闪存 驱动 器。 
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e 显示 屏 (screen). 

e 打印 机 。 

需要 注意 的 是 ， 磁 盘 驱 动 器 和 USB 闪存 驱动 器 既 可 以 作为 输入 设备 也 可 以 作为 输出 设 
备 。 当 磁盘 用 于 输入 时 ， 这 个 过 程 叫 作 读 ; 当 磁 盘 用 于 输 
出 时 ， 这 个 过 程 叫 作 号 。 [i | Loru) We Eo, 

显示 屏 是 一 种 类 似 于 电视 机 屏幕 的 视觉 显示 设备 ， 它 
可 以 是 阴极 射线 管 (CRT) 或 平板 。 显 示 需 是 与 键盘 、CPU . | 7 
分 开 包 装 的 。 终端 (terminal) 是 显示 器 加 键盘 。 终 端 虽然 图 1-16 be rede pace nes 
工作 站 和 大 型 主机 通信 ， 没 有 这 些 后 台 设 备 ， 终 端 是 没有 
用 的 。 另 一 方面 ， 个 人 计算 机 是 完备 的 ， 就 算 不 连接 到 更 大 的 机 器 也 能 处 理 信 息 。 个 人 计算 
机 也 能 像 终 端 一 样 和 其 他 机 器 通信 。 在 计算 机 发 展 的 早期 ， 一 台 标 准 终 端 显示 屏 有 24 行文 
本 ， 一 行 最 多 80 个 字符 。 随 着 图 形 用 户 界 面 的 出 现 ， 显 示 屏 的 大 小 不 再 是 固定 的 文本 行 数 ， 
因为 窗口 和 对 话 框 的 大 小 可 以 是 各 种 各 样 的 。 不 过 ， 个 人 计算 机 上 的 终端 仿真 器 程序 在 代表 
终端 的 窗口 中 有 时 遵循 24 行 80 字符 的 老 标 准 。 

显示 屏 上 的 单个 字符 实际 上 是 由 一 个 矩形 点 阵 网 格 组 成 ， 每 个 点 称 为 像素 (pixel)， 它 
代表 图 像 的 元 素 。 在 黑白 显示 屏 上 ,一 个 像素 或 明 或 暗 。 和 矩形 网 格 中 亮 像 素 的 模式 形成 了 
字符 的 图 像 。 图 1-17 显示 了 一 个 形成 字符 “ B” 的 5 列 7 行 的 像素 网 格 。 更 高 质量 的 显示 
屏 在 矩形 网 格 中 有 更 多 的 像素 来 形成 更 平滑 的 字符 图 像 。 你 看 在 9 x 13 REN KP, <B’ 
的 图 像 是 多 么 清晰 。 


DA 





a) 5x7 的 像素 网 格 b) “B” 在 5 x 7 的 像素 网 格 上 的 图 像 c) “B” 在 9 x 13 的 像素 网 格 上 的 图 像 
1-17 甜 形 网 格 上 的 图 像 元 素 (像素 )。b) 中 的 像素 与 c) 中 的 像素 有 相同 的 直径 


打印 机 (printer) 在 性 能 和 价格 方面 的 差别 很 大 。 喷 墨 打 印 机 的 工作 原理 和 显示 屏 上 显 
示 像 素 是 一 样 的 。 当 打印 头 移动 通过 纸张 时 ， 在 适当 的 时 刻 向 纸 面 喷射 小 的 墨 滴 ， 形 成 所 期 
望 的 图 像 。 由 计算 机 程序 来 控制 释放 墨水 的 时 机 。 和 显示 屏 一 样 ， 形 成 单个 字符 的 点 的 数量 
越 多 ， 打 印 出 来 的 图 像 质量 就 越 高。 许多 打印 机 有 多 种 运行 模式 ， 从 低 质量 高 速度 到 高 质量 
低速 度 。 

页 面 打 印 机 是 一 种 高 质量 的 输出 设备 。 大 多 数 页 面 打 印 机 用 激光 束 在 页 面 上 形成 图 
像 。 页 面 打 印 机 的 成 像 系统 也 使 用 像素 ,但 是 像素 间隔 足够 紧密 到 不 易 察觉 。 一 台 常 用 的 
提 面 激光 打印 机 每 英寸 有 600 或 1 200 像素 ,一 台 每 英寸 600 像素 的 打印 机 每 平方 英寸 有 
600X600( 即 360 000 ) 像素 ， 而 商用 排版 机 器 每 英寸 有 2 400 像素 或 者 更 多 。 


1.2.3 Eas 
主 存储 器 ( main memory， 人 简称 为 主 存 ) 存储 被 处 理 的 数据 和 处 理 数 据 的 程序 。 和 磁盘 
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一 样 ， 主 存 也 是 用 字 节 来 度量 其 容量 的 。 小 的 个 人 计算 机 通常 有 1 GB 主 存 ， 大 的 能 够 达 
到 8 GB; 工作 站 通常 有 大 于 8 GB 的 主 存 ; 而 大 型 主机 有 数 百 GB 的 主 存 。 

主 存 的 一 个 重要 特性 是 ， 它 是 易 失 的 。 即 ， 如 果 计 算 机 的 供电 被 有 意 或 无 意 地 中 断 ， 那 
么 主 存 中 的 信息 就 会 丢失 ， 而 磁盘 不 会 这 样 。 你 可 以 从 一 台 计 算 机 上 拔 掉 USB NEF, XH 
机 器 ， 第 二 天 回来 时 信息 仍然 在 你 的 闪存 里 。 

主 存 的 另 一 个 重要 特性 是 ， 它 的 访问 方式 是 随机 的 。 实 际 上 ， 组 成 主 存 的 电子 组 件 经 常 
称 作 随 机 访问 存储 器 (Random Access Memory, RAM) 电路 。 不 像 硬 盘 驱 动 器 ， 如 果 你 刚 
从 主 存 的 一 端 获 得 一 些 信息 ， 你 可 以 不 用 经 过 中 间 的 信息 立刻 随机 地 从 另 一 端 得 到 信息 。 


1.2.4 ”中央 处 理 单 元 


中 央 处 理 单元 ( Central Processing Unit, CPU) 包括 控制 计算 机 所 有 其 他 部 分 的 电路 。 
它 有 自己 的 存储 器 ， 称 为 寄存 器 (register), CPU 电路 中 也 永久 固化 有 一 组 指令 。 这 些 指令 
完成 的 工作 有 : 从 存储 器 获取 信息 到 寄存 器 、 加 、 减 、 比 较 、 把 信息 从 寄存 器 存储 回 存储 器 
等 。 指 令 执行 的 顺序 不 是 固定 不 变 的 ， 这 是 由 第 三 层 的 机 器 语言 编写 的 程序 所 决定 的 。 

按照 人 的 标准 ， 机 器 指令 的 执行 是 很 快 的 。CPU 的 速度 一 般 用 GHz ( 即 千 兆 赫兹 ) 来 
度量 。1 Hz 是 每 秒 1 条 指令 ， 因此，1 GHz 就 是 每 秒 10 亿 条 指令 。 

例 1.4 假设 CPU 的 频率 是 2.5 GHz， 执 行 一 条 指令 的 平均 时 长 是 多 少 ? 

2.5 GHz 表示 每 秒 2.5X10 条 指令 ， 那 么 每 条 指令 的 时 长 是 1/ (2.5X10”) = 0.4X10° 
秒 或 400 皮 秒 。 口 

为 了 处 理 存储 在 主 存 中 的 数据 ，CPU 必须 首先 把 数据 放 到 自己 本 地 的 寄存 器 中 ， 然 后 
处 理 这 些 数据 ， 再 把 结果 返回 到 主 存 。 最 终 ， 数 据 必须 传送 到 输出 设备 才能 为 用 户 所 用 。 
图 1-18 展示 了 一 个 完整 作业 的 数据 流 。 
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a) 首先 ， 数据 从 输入 设备 流入 主 存 b) 接着 ，CPU 把 数据 放 进 它 的 寄存 器 中 进行 处 理 


Em Cem) E FE 


— > 


c) 然后 ，CPU 把 处 理 过 的 数据 送 回 主 存 d) 最 后 ， 结 果 送 到 输出 设备 
图 1-18 ”一 个 完整 作业 的 数据 流 。 步 骤 b) 和 ec) 通常 会 重复 多 次 














1.3 ”软件 


F $ (algorithm) 是 一 组 指令 ， 按 照 适 当 的 顺序 执行 ， 在 有 限 的 时 间 内 解决 一 个 问 
题 。 算 法 并 不 一 定 需要 计算 机 。 图 1-19 是 一 个 用 中 文 表 达 的 算法 ， 解 决 制作 6 份 奶 油 冻 
的 问题 。 

这 份 食谱 说 明了 算法 的 两 个 重要 性 质 一 有限 数量 的 指令 和 在 有 限时 间 内 执行 。 这 个 算 
法 有 7 条 指令 一 一 混合 、 搅 拌 、 训 调 、 关 火 、 冷 却 、 添 加 和 放疗 。7 是 一 个 有 限 的 数量 。 算 
法 中 指令 的 数量 不 能 是 无 限 的 。 
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14 $-#D “应 用 层 ( 萝 7 层 ) 


原料 
3 个 轻微 搅 打 的 鸡蛋 
% 杯 白 砂糖 
2 EY), AU 
Vo 茶匙 香草 
算法 
将 鸡蛋 、 白 砂糖 和 1/4 茶匙 盐 混 合 。 


缓慢 边 倒 进 边 搅拌 略微 冷却 的 牛奶 。 

放 进 双 层 蒸 锅 的 上 层 蒸 制 ， 持 续 搅拌 ， 下 层 是 热 的 但 是 没有 沸腾 的 水 。 
只 要 奶油 冻 能 里 住 金属 汤匙 的 表面 ， 就 去 火 。 

立即 冷却 一 一 将 平底 锅 放 入 冷水 并 搅拌 1 一 2 分 钟 。 

加 入 香草 。 

放 凉 即 可 。 





图 1-19 ”制作 搅拌 奶油 冻 的 算法 


(来 源 : 选 自 《 Better Homes and Gardens New Cook Book) (更 好 的 家 和 花园 系列 之 新 菜谱 大 全 )。Meredith 
公司 版 权 所 有 ，1981 ) 


尽管 奶油 冻 算法 的 指令 数量 是 有 限 的 ,但 是 它 的 执行 有 一 个 潜在 的 问题 。 食 谱 告 诉 我 
们 一 直 蒸 到 和 蛋 奶 能 够 庄 住 金属 汤匙 ， 但 是 如 果 它 一 直 不 能 右 住 汤匙 怎么 办 呢 ? 那么 如 果 严 格 
遵照 指令 ， 我 们 就 要 一 直 蒸 下 去 ! 一 个 有 效 的 算法 绝 不 能 无 休止 地 执行 。 它 必须 提供 一 个 在 
有 限时 间 内 解决 问题 的 方案 。 假 设 奶 油 总 是 能 囊 住 汤匙 ， 那 么 这 个 食谱 就 是 一 个 真正 的 算 
ele 

程序 (program) 是 在 计算 机 上 执行 的 算法 。 程 序 不 能 用 自然 语言 编写 ， 必 须 用 计算 机 
系统 的 7 层 之 一 的 语言 编写 。 

通用 计算 机 可 以 解决 不 同 种 类 的 问题 ， 从 计算 公司 的 工资 表 到 修正 备忘录 中 的 拼写 错 
误 。 能 够 对 硬件 编程 让 它 做 不 同 的 事情 ,硬件 的 多 功能 正 是 来 源 于 此 。 控 制 计算 机 的 程序 称 
为 软件 (software). 

软件 分 为 两 大 类 : 

e 系统 软件 。 

© 应 用 软件 。 

系统 软件 (system software) 使 应 用 设计 者 可 以 接 人 计算 机 。 同 样 的 道理 ， 应 用 软件 
( applications software) 使 位 于 App7 层 的 用 户 可 以 使 用 计算 机 。 一 般 来 说 ， 系 统 软件 工程 
师 在 HOL6 层 和 更 低层 设计 程序 ， 这 些 程序 处 理 计 算 机 系统 中 应 用 程序 员 不 想 费 心 的 许多 
AA o 


1.3.1 操作 系统 


计算 机 最 重要 的 软件 是 操作 系统 ， 操 作 系 统 (operating system) 是 使 硬件 可 用 的 系统 程 
序 。 每 个 通用 计算 机 系统 都 包括 硬件 和 一 个 操作 系统 。 

为 了 有 效 地 学 习 本 书 ， 你 必须 能 够 使 用 一 台 有 操作 系统 的 计算 机 。 一 些 常 用 的 商用 操作 
系统 包括 Microsoft Windows, Mac OS X, UNIX 和 Linux。 不 幸 的 是 ， 每 个 操作 系统 都 有 
自己 独特 的 命令 。 本 书 不 可 能 解释 怎样 使 用 所 有 不 同 的 操作 系统 ， 你 必须 从 你 的 老师 或 其 他 
资源 那里 学 习 你 的 操作 系统 的 详细 内 容 。 

操作 系统 有 3 个 通用 功能 : 

e 文件 管理 。 
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o fF ftir es ， 

o 处 理 右 管理 。 

在 3 个 功能 中 ” 对 用 户 来 说 文件 管理 是 最 直观 的 。 计 算 机 新 手 要 学 会 的 第 一 件 事情 就 是 
如 何 操 作 操 作 系 统 中 的 信息 文件 。 

操作 系统 中 的 文件 类 似 于 办 公 室 中 的 文件 ， 它 们 包括 应 要 求 被 检索 和 处 理 的 信息 。 在 办 
公 室 中 ,文件 柜 存 储 文件 ; 在 操作 系统 中 ， 外 围 存 储 句 设备 存储 文件 。 尽 管 磁带 和 磁盘 都 能 
存储 文件 ， 但 是 下 面 的 讨论 集中 于 磁盘 。 

在 办 公 室 中 ， 每 个 文件 放 在 一 个 文件 夹 中 。 办 公 室 工作 人 员 给 每 个 文件 命名 ， 并 且 在 文 
件 夹 的 标签 上 标注 文件 名 。 文 件 名 指示 文件 夹 的 内 容 ， 也 便于 从 文件 柜 中 取出 某 个 特定 的 文 
件 。 在 操作 系统 中 ， 每 个 文件 也 有 名 字 ， 这 个 文件 名 起 到 与 标注 在 文件 夹 上 的 名 字 同 样 的 作 
用 一 一 便于 从 磁盘 上 找 出 某 个 文件 。 

当 计 算 机 用 户 创 建 一 个 文件 时 ， 操 作 系 统 会 要 求 给 这 个 文件 起 一 个 名 字 。 根 据 系统 不 
同 ， 通常 对 文件 名 长 度 和 其 中 允许 使 用 的 字符 有 一 些 限 制 。 有 时 ， 系 统 会 自动 给 名 字 附 加 一 
个 前 缀 或 者 后 级 。 除 了 用 户 创 建 的 文件 外 ， 其 他 的 文件 由 系统 生成 并 由 它 自动 命名 。 

文件 可 以 包含 3 种 类 型 的 信息 : 

e 文档 。 

© 程序 。 

© 数据 。 

文档 可 以 是 公司 备 走 录 、 信 件 和 报告 等 。 文 件 也 可 以 存储 计算 机 执行 的 程序 。 要 执行 程 
序 时 ， 首 先 要 把 它们 从 磁盘 加 载 到 主 存 中 。 一 个 正在 执行 的 程序 的 输入 数据 可 以 来 自 文件 ， 
而 输出 数据 也 可 以 发 送 到 文件 。 

物理 上 文件 散布 在 磁盘 的 表面 。 为 了 记录 所 有 这 些 信 息 文 件 ， 操 作 系统 维护 文件 的 目 
录 。 目 录 是 磁盘 上 所 有 文件 的 一 个 列表 ， 目 录 中 的 每 个 条 目 都 包括 文件 名 字 、 大 小 、 在 磁盘 
上 的 物理 位 置 和 其 他 任何 操作 系统 管理 文件 所 需 的 信息 。 目 录 本 身 也 存储 在 磁盘 上 。 

操作 系统 回 用 户 提供 了 一 种 操作 磁盘 上 文件 的 方法 。 一 些 典 型 的 操作 系统 命令 包括 : 

o 列 出 目录 中 的 文件 名 。 

o 从 磁盘 删除 文件 。 

e 更 改 文件 名 。 

e 打印 文件 内 容 。 

© 执行 应 用 程序 。 

要 解 答 本 书 中 的 问题 ， 你 需要 学 习 你 的 操作 系统 上 的 这 些 命令 。 

你 的 操作 系统 是 由 一 组 系统 程序 员 针 对 你 的 计算 机 编写 的 一 个 程序 。 当 你 发 出 从 磁盘 删 
除 一 个 文件 的 命令 时 ， 系 统 程序 会 执行 这 条 命令 。 你 ， 作 为 用 户 ， 正 在 使 用 其 他 人 ， 即 系统 
程序 员 ， 写 的 一 个 程序 。 


1.3.2 ”软件 分 析 和 设计 


软件 ， 无 论 系统 软件 还 是 应 用 软件 ， 和 文学 有 很 多 共同 点 。 两 者 都 是 人 写 的 。 尽 管 计算 
机 也 能 读 并 执行 程序 ， 但 人 能 阅读 这 两 样 东 西 。 小 说 家 和 程序 员 都 很 有 创造 性 ， 因 为 他 们 提 
出 的 解决 方案 并 不 是 唯一 的 。 当 小 说 家 想 要 传达 某 些 东西 时 ， 总 是 有 不 止 一 种 的 表达 方式 。 


Fea 


好 小 说 和 坏 小 说 之 间 的 差别 不 仅 体 现在 要 表达 的 主题 上 ， 还 体现 于 表达 的 方式 。 同 样 , 程序 2o] 
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员 要 解决 一 个 问题 时 ， 解 决 方案 总 有 不 止 一 种 编程 方法 。 好 程序 和 坏 程序 之 间 的 差别 不 仅 体 
现在 解决 方案 对 问题 解答 的 正确 性 上 ， 还 体现 在 程序 的 其 他 特性 上 ， 比 如 清晰 程度 、 执 行 速 
BE RIMS FR ie ait AY BE OK o 

文学 专业 的 学 生 要 从 事 两 项 活动 一 一 阅读 和 写作 。 阅 读 是 分 析 ， 读 其 他 人 写 的 东西 并 
分 析 它 的 内 容 。 写 是 设计 或 综合 ， 要 表达 一 个 观点 ， 你 需要 做 的 是 有 效 地 传达 这 个 观点 。 大 
多 数 人 觉得 写 比 读 难 多 了 ， 因 为 它 要 求 有 更 多 的 创造 力 。 这 也 正 是 大 众 中 读者 比 作家 多 的 
原因 。 

类 似 地 ， 作 为 一 个 软件 专业 的 学 生 ， 你 将 分 析 和 输入 
设计 程序 。 要 牢记 程序 的 3 个 活动 是 输入 、 处 理 和 输 。a 分 析 - 给 定 输入 和 处 理 ， 确 定 输出 
出 。 在 分 析 时 ， 给 出 的 是 输入 和 处 理 指 令 ， 问 题 是 确 
定 输出 。 在 设计 时 ， 给 出 的 是 输入 和 预期 的 输出 , 问 E Aa 
题 是 写 出 处 理 指令 ， 这 就 是 软件 设计 。 图 1-20 展示 了 OO ARANEA, AE 
分 析 和 设计 之 间 的 不 同 。 图 1-20 ”分 析 与 设计 的 不 同 

如 同文 学 中 的 阅读 和 写作 ， 设 计 优 秀 软 件 比 分 析 优 秀 软件 困难 很 多 。 计 算 机 专业 的 学 
生 最 熟悉 的 抱怨 是 “我 能 理解 概念 ， 但 是 我 不 会 写 程序 。” 这 是 一 个 很 自然 的 抱怨 ， 因 为 它 
反映 了 综合 相对 于 分 析 的 困难 之 处 。 我 们 的 终极 目标 是 让 你 能 够 分 析 软 件 ， 同 样 能 够 设计 软 
件 。 下面 的 几 章 将 教 你 一 些 具体 的 软件 设计 技术 。 

不 过 ， 首 先 你 得 熟悉 求解 问题 的 一 般 性 指导 原则 ， 它 们 同样 适用 于 软件 设计 : 

e 理解 问题 。 

e 概括 解决 方案 。 

e 解决 概括 出 的 问题 的 各 个 部 分 。 

© 手工 验证 你 的 解决 方案 。 

e 在 计算 机 上 验证 你 的 解决 方案 。 

当面 对 一 个 软件 设计 问题 时 ， 通 过 写 下 一 些 样 本 输入 和 相应 的 输出 ， 可 以 检测 你 对 问 
题 的 理解 。 如 果 你 不 知道 怎么 手工 解决 一 个 问题 ， 就 不 可 能 通过 计算 机 解决 这 个 问题 。 要 概 
述 问 题 的 解决 方案 ， 你 必须 把 问题 分 解 成 几 个 子 问题 ， 因 为 子 问题 比 原始 问题 小 ， 更 容易 解 
决 。 如 果 你 对 程序 的 正确 性 有 疑问 ， 应 该 在 把 它 输入 计算 机 之 前 手工 验证 它 。 可 以 用 在 第 一 
步 中 写 出 的 样本 输入 来 对 它 进行 测试 。 

很 多 学 生 认 为 这 些 步 又 对 人 门 性 教材 中 的 小 程序 不 是 很 上 必要。 如 果 对 你 来 说 问题 很 简 
单 ， 那 么 在 编写 解决 方案 之 前 ， 也 可 以 不 在 纸 上 组 织 思路 。 不 过 ， 这 种 情况 下 ， 你 还 是 要 在 
心里 按照 这 些 步 又 进行 思考 。 男 一 方面 ， 你 终究 会 碰 到 大 的 设计 问题 ， 那 么 这 些 解 决 问题 的 
步骤 将 是 不 可 或 缺 的 。 


1.4 数据 库 系 统 


数据 库 系 统 是 App7 层 最 常见 的 应 用 之 一 。 数 据 库 (database) 是 包括 相关 联 信息 的 文件 
汇集 ， 而 数据 库 系 统 ( database system) (也 称 作 数据 库 管 理 系统 ，DBMS) 是 一 个 让 用 户 在 
数据 库 中 添加 、 删 除 和 修改 记录 的 程序 ， 它 也 允许 对 数据 库 进行 查询 。 查 询 (query) 是 对 信 
息 的 请 求 ， 所 请 求 的 信息 通常 来 自 数 据 库 的 不 同 部 分 。 

这 里 有 一 个 数据 库 的 例子 ， 一 个 家 具 制 造 商 利用 数据 库 维 护 有 关 它 的 库存 、 零 件 供应 商 
和 货运 的 信息 。 查 询 可 能 是 请 求 一 个 报告 ， 显 示人 仓库 中 制造 某 一 款 沙发 所 需 部 件 的 数量 。 为 
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了 生成 这 个 报告 ， 数 据 库 系统 将 来 自 数据 库 中 不 同 部 分 的 信息 组 合 起 来 ， 在 这 个 例子 中 信息 
来 自 库存 文件 和 制造 该 沙发 所 需 原料 的 文件 。 

数据 库 系 统 主要 分 为 3 类 : 层次 型 系统 、 网 状 型 系统 和 关系 型 系统 。 在 这 3 种 类 型 的 数 
据 库 系统 中 ， 层 次 型 系统 是 最 快 的 ， 但 对 用 户 来 说 是 最 受 限制 的 。 如 果 你 能 自然 地 把 数据 库 
中 的 信息 组 织 成 像 层 次 图 那样 的 结构 ， 这 个 系统 就 是 很 适合 的 。 网 状 型 系统 比 层次 型 系统 更 
灵活 ， 但 是 对 用 户 来 说 ， 它 比 关系 型 数据 库 系统 更 难 一 些 。 

关系 型 系统 是 三 者 中 最 常见 的 ， 它 是 App7 层 上 最 灵活 也 最 容易 使 用 的 。 但 是 在 计算 机 
系统 中 ， 没 有 免费 的 午餐 ， 它 获得 高 灵活 性 的 代价 是 ， 相 比 于 其 他 数据 库 系 统 ， 它 的 速度 更 
低 。 这 一 节 描 述 关 系 型 DBMS 背后 的 基本 思想 。 


1.4.1 关系 


关系 型 数据 库 系 统 (relational database system) 把 信息 存储 在 文件 中 ， 对 外 呈现 表 结 构 。 
每 个 表 有 固定 的 列 数 和 可 变 的 行 数 。 图 1-21 是 一 个 关系 型 数据 库 中 信息 的 示例 。 每 个 表 有 
一 个 名 字 。 名 为 Sor 的 表 包 含 姐 妹 会 成 员 的 信息 ， 名 为 Frat 的 表 包 含 兄 弟 会 成 员 的 信息 。 
位 于 App7 层 的 用 户 先 固定 每 个 表 中 垂直 的 列 数 ， 再 在 表 体 中 输入 信息 。 水 平方 向 的 行 数 是 
可 变 的 ， 这 样 能 够 在 表 中 增加 或 者 删除 人 员 。 
Frat 


Math 


English 





图 1-21 一 个 关系 型 数据 库 的 示例 。 这 个 数据 库 包括 两 个 关系 : Sor M Frat 


在 关系 型 数据 库 术 语 中 ， 表 称 作 关系 (relation)， 列 为 属性 (attribute)， 行 叫 元 组 
(tuple， 与 couple 同 韵 )。 在 图 1-21 中，Sor 和 Frat 是 关系 , (Nancy, Jr, Math, NY) 
是 Sor 的 一 个 四 元 组 ， 因 为 它 有 4 个 元 素 ， 而 F.Major 是 Frat 的 一 个 属性 。 属 性 的 域 
(domain) 是 该 属性 所 有 可 能 值 的 集合 。S .Major 和 F.Major 的 域 是 集合 {Hist, Math, 
CompSci, PolySci, English}. 


Edgar Codd 
Edgar Codd 于 1923 年 出 生 在 英格兰 多 塞 特 郡 波 特 兰 市 ， 
是 7 个 孩子 中 最 小 的 一 个 。 他 曾经 就 读 于 牛津 大 学 ， 主 修 数 


学 和 化 学 专业 。 第 二 次 世界 大 战 期 间 他 是 皇家 空军 的 飞行 
员 。1948 年 ， 他 移居 纽约 ， 就 职 于 IBM。 不 满 于 参议 院 约 瑟 
k- 麦卡锡 对 所 谓 的 共产 主义 同情 者 的 攻击 ， 他 搬 到 沽 太 华 
居住 ，20 世纪 50 年 代 早 期 生活 在 这 里 。 
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Codd RA EKIRKFEMED RR T HADA SS LES, R tmk) 
福 尼 亚 州 圣何塞 市 ， 就 职 于 IBM 研究 实验 室 。1970 年 ， 他 写 出 了 里 程 碑 式 的 论文 “A 
Relational Model of Data for Large Shared Data Banks”( 大 型 共享 数据 库 的 关系 数据 模型 )。 
在 该 论文 发 表 时 ， 数 据 库 系统 的 用 户 接口 是 在 较 低 的 抽象 层次 上 。 要 执行 一 个 查询 ， 用 户 
不 得 不 使 用 复杂 的 查询 语言 ， 该 语言 依赖 于 数据 在 磁盘 上 存储 方式 的 细节 。Codd 的 关系 
型 数据 库 语 言 把 用 户 放 在 了 较 高 的 抽象 层次 上 ， 隐 藏 了 原 有 语言 中 用 户 进行 查询 所 需要 知 
道 的 细节 。Codd、Don Chamberlin 和 Ray Boyce 一 起 发 明了 结构 化 查询 语言 (Structured 
Query Language, SQL), SQL 语言 已 经 成 为 关系 型 数据 库 查 询 的 标准 语言 。 

对 Codd 来 说 不 幸 的 是 ，IBM 并 没有 像 它 的 竞争 对 手 那样 迅速 认识 到 Codd 工作 的 商 
业 价 值 。 直 到 Larry Ellison 以 Codd 的 研究 为 基础 创建 了 一 家 公司 ， 就 是 后 来 的 Oracle 
(甲骨 文 )。1973 年 ，IBM 开始 了 System R 计划 ， 验 证 Codd 的 关系 型 理论 。 最 终 在 1978 
年 ，Codd 论文 发 表 整 整 8 年 后 ，IBM 开始 构建 商用 关系 型 数据 库 产品 。 

Edgar Codd 被 广泛 认为 是 关系 型 数据 库 的 发 明 者 。1981 年 ， 由 于 他 在 数据 库 管 理 系 
统 理论 和 实践 方面 基础 而 持续 的 贡献 ， 他 被 授予 图 灵 奖 。Codd 于 2003 年 在 佛罗里达 州 威 
廉 姆 斯 岛 的 家 中 逝世 ， 享 年 79 岁 。 





1.4.2 ”查询 

请 求 Ron 的 家 乡 州 、 请 求 姐 妹 会 中 所 有 二 年 级 学 生 的 名 字 ， 这 些 都 是 从 该 数据 库 进 行 
查询 的 例子 。 请 求 一 个 列表 、 列 出 所 有 具有 相同 专 Resultl Result2 
业 的 兄弟 会 和 姐妹 会 成 员 以 及 该 专业 的 名 字 ， 是 另 


一 个 查询 的 例 o 


在 这 个 小 例子 中 ， 你 可 以 手工 搜索 数据 库 来 确 
定 每 个 查询 的 结果 。Ron 的 家 乡 州 是 OR，Beth 和 
Allison 是 姐妹 会 中 二 年 级 学 生 。 第 三 个 查询 制 成 表 
格 稍 微 有 点 难度 : Beth 和 Je 和 任 是 历史 专业 ; Nancy 
All Ron 是 数学 专业 ，Nancy 和 Mehdi 也 是 ; Robin 


Allison 





Result3 


Nancy Math 


和 Je 任 是 历史 专业 等 。 Nancy Math 

有 趣 的 是 ， 每 个 查询 结果 都 可 以 以 表格 的 形式 Hist 
列 出 来 ( 见 图 1-22 ) 。 第 一 个 查询 的 结果 是 一 个 1 Allison 
列 1 行 的 表格 ， 第 二 个 查询 的 结果 是 一 个 1 列 2 行 | Aison | Mehdi | Mah 
的 表格 ， 而 第 三 个 查询 的 结果 是 一 个 3 列 8 行 的 表 
格 。 关系 型 数据 库 是 关系 的 汇集 ， 而 一 个 对 关系 型 Lulwa | Gary | | CompSci ci 


数据 库 查询 的 结果 本 身 也 是 一 个 关系 ! 1-22 ”对 图 1-21 所 示 的 数据 库 进行 3 次 
查询 结果 本 身 就 是 关系 这 一 事实 是 关系 型 数据 i aai 
库 系统 一 个 强大 的 理念 。Apps7 层 的 用 户 把 数据 库 5 
看 作 关 系 的 汇集 ， 用 户 的 查询 就 是 请 求 从 数据 库 现 有 的 关系 中 衍生 出 另 一 个 关系 。 
记 住 每 层 都 有 自己 的 语言 。Apps7 层 关 系 型 DBMS 的 语言 是 一 组 对 现 有 关系 进行 组 合 
或 者 修改 并 产生 新 关系 的 命令 。Apps7 层 的 用 户 使 用 这 些 命令 生成 想 要 的 结果 。 图 1-23 展 
示 了 数据 库 、 查 询 和 结果 之 间 的 关系 。 数 据 库 是 输入 ， 查 询 是 一 组 Apps7 层 语言 写 的 命令 。 
就 像 在 计算 机 系统 中 所 有 层 上 一 样 ， 三 者 之 间 的 关系 都 是 一 样 的 形式 : 输入 、 处 理 和 输出 。 
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本 章 不 描述 市 场 上 每 种 关系 型 数据 库 系统 的 每 种 语言 ， 而 是 描述 一 种 具备 这 样 一 些 系 统 典 
型 特征 的 简化 语言 。 大 多 数 关 系 型 DBMS 语言 有 许多 输入 处 理 输出 
强大 的 命令 ， 但 是 3 个 命令 是 最 基础 的 歼 据 库 
project 和 join。 

select fil project 语句 类 似 ， 因 为 它们 都 是 图 1-23 BE. RAMA CAMARA 
对 单个 关系 进行 操作 ， 生 成 一 个 修改 的 关系 。select 语句 是 从 一 个 特定 的 表 中 提取 满足 语 
句 中 指定 条 件 的 行 。project 语句 是 根据 语句 中 指定 的 属性 从 一 个 特定 的 表 中 提取 一 组 列 。 
图 1-24 说 明了 语句 


select Frat where F.Major = English giving Templ 





select, 


All 


project Sor over S.Name giving Temp2 


Templ 


a) select Frat where b) project Sor over S.Name c)project Sor over (S.Class, 
F.Major=English giving Temp] giving Temp2 S.State) giving Temp3 


图 1-24 select Al project 操作 符 
project 语句 可 以 指定 多 列 ， 此 时 属性 用 圆 括 号 括 起 来 ， 并 用 逗号 分 隔 。 例 如 ， 


project Sor over (S.Class, S.State) giving Temp3 
从 Sor 关系 中 选 出 两 个 属性 。 
注意 ， 在 图 1-24c 中 (Sr, CA) 对 是 关系 Sor (WA 1-21) 中 的 四 元 组 (Robin，Sr， 
Hist, CA) 和 (Lulwa, Sr, CompSci, CA) 都 有 的 ， 但 是 这 一 对 在 关系 Temp3 中 不 重复 出 现 。 
关系 的 一 个 基本 性 质 就 是 在 任何 表 中 不 能 有 重复 的 行 。project 操作 符 会 检测 重复 行 , 不 |F 
允许 它们 存在 。 从 数学 上 说 ， 关 系 就 是 元 组 的 集合 ， 集 合 中 的 元 素 不 能 有 重复 。 D 
join 与 select 和 project 不 同 ， 它 的 输入 是 两 个 表 ， 而 不 是 一 个 。 第 一 个 表 的 一 列 和 第 二 
个 表 的 一 列 被 指定 作为 join 列 。 每 个 表 的 
join 列 必须 有 相同 的 域 。 两 个 表 join 的 结 | S-Name | S.Class |s.state| Major |F.Name 
果 是 一 个 更 宽 的 表 ， 除 了 join 列 只 出 现 一 


次 以 外 ， 它 的 列 和 两 个 表 中 原始 的 列 完全 =o 
相同 ; 结果 表 的 行 就 是 在 两 个 原始 表 中 在 “| 上 acy 
Roin |sr | < 













join 列 有 相同 元 素 的 那些 行 。 
例如 ， 在 图 1-21 中 ，S.Major 列 和 
F.Major 有 相同 的 域 。 语 名 


join Sor and Frat over Major giving Temp4 


er | 
Ron | OR | 
[Math | Mehdi | CA | 
Je | Tx 
SES 
i| ca | 
| WA 
| cA 


fi AE Major fF A join jl, KA Sor 和 图 1-25 join 操作 符 。 该 关系 来 自 于 语句 join Sor 
Frat 在 这 一 列 上 进行 合并 。 图 1-25 显示 and Frat over Major giving Temp4 





20 P-R BAB(FT7Z) 


了 两 个 表 join 后 的 行 是 那些 专业 相同 的 行 。Sor 的 四 元 组 (Robin，Sr Hist, CA) 和 Frat 的 
三 元 组 (Jeff, Hist, TX) 合并 在 Temp4 中 ， 因 为 它们 的 专业 (Hist) 是 一 样 的 。 


1.4.3 语言 结构 
App7 层 语言 的 语句 有 如 下 格式 : 


select 关系 where 条 件 giving 关系 
project 关系 over 属性 giving 关系 
join 关系 and 关系 over 属性 giving 关系 


语言 的 保留 字 包 括 


select project 
join and 
where over 


giving 


正如 前 面 的 例子 展示 的 那样 ， 每 个 保留 字 在 语言 中 都 有 特定 的 含义 。 在 语言 中 识别 对 象 
的 单词 ， 例 如 Sor Al Temp2 用 于 标识 关系 ， 而 F.state 用 于 标识 属性 ， 都 不 是 保留 字 。 它 
们 是 App7 层 的 用 户 随意 生成 的 ， 称 为 标识 符 〈identifier)。 保 留 字 和 用 户 定义 的 标识 符 在 典 
型 计算 机 系统 的 所 有 层 语言 中 都 是 很 常见 的 。 

你 知道 怎样 用 select. project 和 join 语句 来 生成 图 1-22 中 的 查询 结果 吗 ? 第 一 个 
询问 Ron 的 家 乡 州 的 查询 语句 是 


select Frat where F.Name = Ron giving Temp5 
project Temp5 over F.State giving Resultl 


第 二 个 询问 姐妹 会 中 所 有 二 年 级 学 生 名 字 的 查询 语句 是 


select Sor where S.Class = Soph giving Temp6 
project Temp6 over S.Name giving Result2 


第 三 个 请 求 查询 一 个 列表 ， 表 中 列 出 专业 一 样 的 兄弟 会 和 姐妹 会 的 成 员 以 及 他 们 共同 的 
专业 ,该 查询 的 语句 是 


join Sor and Frat over Major giving Temp4 
project Temp4 over (S.Name, F.Name, Major) giving Result3 


总 结 


计算 机 科学 的 基础 问题 是 : 什么 能 够 被 自动 化 ?计算 机 把 信息 处 理 自动 化 了 。 本 书 的 主 
题 是 计算 机 系统 中 的 抽象 层次 。 抽 和 象 包括 隐瞒 细节 以 展示 物质 的 本 质 ， 概 要 结构 ， 通 过 一 连 
串 的 命令 划分 责任 ， 将 一 个 系统 细 分 成 较 小 的 子 系统 。 一 个 典型 计算 机 系统 的 7 个 抽象 层次 是 

第 7 层 (App7 ): 应 用 层 

第 6 层 (HOL6): 高 级 语言 层 

第 5 层 (Asmb5 ): 汇编 层 

第 4 层 (OS4 ): 操作 系统 层 

第 3 JZ (ISA3 ): 指令 集 架 构 层 
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第 2 层 (Mc2 ): BRIBE 

第 1 层 (LGI): 逻辑 门 层 
每 层 都 有 自己 的 语言 ， 目 的 是 隐藏 更 低层 的 细节 。 

计算 机 系统 由 硬件 和 软件 组 成 。 硬 件 的 4 个 组 成 部 分 是 输入 设备 、 中 央 处 理 单 元 、 主 存 
储 器 和 输出 设备 。 控 制 计 算 机 的 程序 叫 作 软件 。 

算法 是 一 组 指令 ， 依 照 适 当 的 顺序 执行 ， 在 有 限 的 时 间 内 解决 问题 。 程 序 是 计算 机 上 执 
行 的 算法 。 程 序 输入 信息 ， 处 理 信 息 并 输出 结果 。 

数据 库 系统 是 App7 层 最 常见 的 一 种 应 用 。 关 系 型 数据 库 系统 把 信息 存储 在 呈现 为 表 结 
构 的 文件 中 ， 这 个 表 称 作 关 系 。 关 系 型 数据 库 系统 中 的 查询 结果 本 和 喘 就 是 关系 。 关 系 型 数据 
库 系 统 中 最 基本 的 3 个 操作 是 select, project 和 join。 查询 是 这 3 种 操作 的 组 合 。 


练习 


本 书 每 章 的 最 后 都 有 一 组 练习 和 问题 。 请 在 纸 上 手 工 做 这 些 练习 。 带 星 号 练习 的 答案 在 本 书 的 
后 面 (对 一 些 有 多 个 部 分 的 练习 ， 可 能 只 有 部 分 答案 )。 问 题 是 要 输入 计算 机 中 的 程序 ， 本 章 仅 包括 


练习 。 
1.1 节 
1. (a) 请 画 一 个 对 应 美国 宪法 的 层次 结构 图 。(b) 依照 图 1-5， 男 一 个 对 应 假定 的 出 版 公司 的 组 织 结 
Pik E Al. 


2. 成 吉 思 汗 把 他 的 战士 以 10 人 为 一 组 组 成 十 人 队 ， 由 “ 什 长 ”率领 ; 10 个 “ 什 长 ”由 1 个 “ 百 夫 长 ” 
率领 ; 10 个 “ 百 夫 长 ”由 1 个 “千夫 长 ”率领 。 
* (a) 如 果 成 吉 思 汗 在 最 低层 有 10 000 名 战士 ， 那 么 他 手下 总 共有 多 少 人 ? 
(b) 如 果 成 吉 思 汗 在 最 低层 有 5763 名 战士 ， 那 么 他 手下 总 共有 多 少 人 ? 假设 如 果 可 能 ， 有 10 组 
每 组 应 该 10 人 ， 但 是 每 层 可 能 有 一 组 可 以 包含 少 一 些 。 

3.《 圣 经 》 中 ,《 出 埃及 记 》 第 18 章 讲 述 了 作为 以 色 列 唯一 法 官 的 摩西 由 于 要 处 理 大 量 琐碎 的 案件 
而 疲惫 不 堪 。 他 的 岳父 叶 特 罗 向 他 推荐 了 上 诉 法 院 的 分 层 体 系 ， 在 这 个 体系 中 ， 最 底层 的 法 官 负责 
10 个 市 民 ，5 个 管理 10 个 市 民 的 法 官 将 他 们 不 能 解决 的 疑难 案件 交 由 一 个 负责 50 个 市 民 的 法 官 处 
理 ; 2 个 负责 50 个 市 民 的 法 官 在 一 个 负责 100 个 市 民 的 法 官 手 下 工作 ; 10 个 能 负责 100 个 市 民 的 
法 官 在 一 个 负责 1000 个 市 民 的 法 官 手下 工作 ， 能 负责 1000 个 市 民 的 法 官 向 摩西 汇报 ， 这 样 摩西 
只 处 理 最 棘手 的 案件 。* (a) 如 果 市 民 人 口 正好 是 2000 人 (不 包括 法 官 )， 画 出 分 层 体系 最 上 面 的 
三 层 。(b) Æ (a) 中 ,包括 摩西 、 所 有 法 官 和 市 民 的 总 人 口 是 多 少 ?(c) 如 果 市 民 人 口 正好 是 
10 000 人 (不 包括 法 官 )， 包 括 摩西 、 所 有 法 官 和 市 民 的 总 人 口 是 多 少 ? 

4. 完全 二 叉 树 是 一 种 叶子 都 在 同一 层 的 树 ， 而 每 个 非 叶 
子 结 点 下 面 正 好 有 2 个 结 点 。 图 1-26 是 一 个 三 层 的 完 
全 二 叉 树 。* (a) 请 画 出 一 个 四 层 的 完全 二 又 树 。* (b) 

一 个 五 层 的 完全 二 又 树 总 共有 多 少 个 结 点 ?(c) 六 层 的 
WE? (d) NERE? 

izt 

*5. 一 个 打字 员 以 每 分 钟 40 个 单词 的 速度 在 键盘 上 输入 文 图 1-26 练习 4: 一 个 三 层 的 完全 二 又 树 
本 。 如 果 每 个 单词 的 平均 长 度 是 $ 个 字符 ， 那么 每 秒 有 多 少 比 特 传送 到 主 存 呢 ? 一 个 空格 也 是 一 
个 字符 ， 假 定 平均 每 个 单词 后 面 有 一 个 空格 。 

6. 一 个 打字 员 以 每 分 钟 30 个 单词 的 速度 在 键盘 上 输入 文本 。 如 果 每 个 单词 的 平均 长 度 是 6 个 字符 ， 
那么 每 秒 有 多 少 比特 传送 到 主 存 呢 ? 一 个 空格 也 是 一 个 字符 ， 假 定 平 均 每 个 单词 后 面 有 一 个 空格 。 

7. 你 有 2300 首 数字 歌曲 ， 平 均 每 首 歌 的 存储 空间 是 4.6MB。( a) 如 果 把 你 收藏 的 所 有 歌曲 都 烧 制 到 
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650 MB 大 小 的 CD E, 需要 多 少 张 CD ? (b) 如 果 用 4.7 GBA DVD， 需要 多 少 张 ? 
. 你 有 平均 每 张 需要 75KB 存储 空间 的 照片 。(a) 一 张 650 MB 的 CD 上 能 放下 多 少 张 照 片 ? (b) 一 张 
4.7 GB 的 DVD 能 放下 多 少 张 照片 ? 
*9 一 个 显示 屏 上 每 个 字符 对 应 一 个 8X 10 的 像素 矩形 网 格 ， 它 能 显示 24 行 80 列 的 字符 。( a) 这 个 显 
示 屏 总 共有 和 多少 像素 ? (b) 如 果 每 个 像素 以 1 比特 存储 ， 那 么 存储 一 个 显示 屏 画 面 需 要 多 少 KB ? 
10. 一 个 显示 屏 上 每 个 字符 对 应 一 个 5X7 的 像素 矩形 网 格 ， 它 能 显示 24 行 80 列 的 字符 。( a) 这 个 显 
示 屏 有 多 少 像素 ?” (b) 如 果 每 个 像素 以 1 比特 存储 ， 那 么 存储 一 个 显示 屏 画 面 需要 多 少 KB ? 
11. 一 台 桌 面 激 光 打 印 机 的 分 辩 率 是 每 英寸 300 像素 ， 如 果 每 个 像素 存储 在 1 比特 内 存 中 ,那么 存 
本 
r cata: sd ae a 
12. 一 本 中 等 大 小 的 书包 含 大 约 100 万 个 字符 。* (a) ERE i p 
打印 15 个 字符 的 信函 级 质量 打印 机 上 打印 这 本 书 需 要 多 少 小 fii iii | | 
时 ? (b) 假定 每 行 平均 55 个 字符 ， 在 一 台 每 分 钟 打印 600 行 的 OP PE qi 


Eonia U es 


Oo 


一 


打印 机 上 打印 它 需 要 多 少 小 时 ? 
13. 图 1-27 中 的 UPC 符号 代表 哪 两 个 十 进 制 数字 ? 图 1-27 练习 13: 数字 是 UPC 
13% 符号 右 半 部 分 的 字符 


14. 回答 下 列 有 关 操 作 系 统 文件 名 的 问题 。( a) 对 文件 名 的 字符 数 有 限制 吗 ? 如 果 有 ， 限 制 是 什么 ? 
(b) 特定 的 字符 不 允许 做 文件 名 吗 ? 如 果 人 允许 ， 有 问题 吗 ? (c) 你 的 操作 系统 对 文件 名 区 分 大 小 写 
字母 吗 ? 

15. 在 你 的 操作 系统 中 ， 怎 样 执行 下 面 的 步骤 。 (a) 如 果 你 的 机 器 是 一 台大 型 主机 或 者 小 型 计算 机 ， 
登录 系统 ; 如 果 是 一 台 个 人 计算 机 ， 则 启动 系统 。(b) 列 出 目录 中 的 文件 名 。(c) 删除 磁盘 上 的 一 
个 文件 。(d) 更 改 一 个 文件 的 名 字 。(e) 复制 一 个 文件 。(f) 打印 一 个 文件 的 内 容 。 

1.475 
*16. 根据 本 章 1.4 节 中 的 讨论 ， 写 出 关系 Temp5 和 Temp6。 

17. 写 出 对 图 1-21 中 的 数据 库 进行 下 列 查询 的 语句 。* (a) Rih Beth 的 家 乡 州 。(b) 列 出 英语 专业 的 
兄弟 会 成 员 。(c) 列 出 有 相同 家 乡 州 的 兄弟 会 和 姐妹 会 成 员 以 及 家 乡 州 的 名 字 。 

18. (a) 写 出 生成 图 1-22 中 Result2 的 语句 ， 但 是 要 先 用 project 命令 ， 再 用 select 命令 。(b) 5 
出 生成 图 1-22 中 Result3 的 语句 ， 但 是 最 后 一 条 语句 需 是 join. 
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第 2 音 | 


Computer Systems, Fourth Edition 


Crt 


程序 输入 信息 ， 处 理 信 息 并 输出 结果 。 本 章 展示 了 一 个 C++ 程序 怎样 输入 、 处 理 和 和 输 
出 数值 。 本 章 讲 述 HOL6 层 的 编程 ， 我 们 假定 你 已 经 有 一 些 用 高 级 语言 编程 的 经 验 ， 不 一 定 
非 要 是 C++， 例 如 可 以 是 C、Java 或 Ada。 因 为 本 书 表达 的 概念 对 所 有 这 些 语言 都 是 通用 的 ， 
所 以 虽然 C++ 与 你 熟悉 的 语言 可 能 有 所 不 同 ,但 是 你 仍然 能 够 看 懂 本 章 的 讨论 。 


2.1 变量 
” ”计算 机 只 能 执行 ISA3 层 (指令 集 架构 层 ) 上 的 机 器 语言 语句 。 因 此 HOL6 层 的 语句 必 
须 先 被 翻译 到 ISA3 层 ， 然 后 才能 执行 。 图 2-1 展示 了 编 
译 器 的 功能 ， 它 执行 从 HOL6 层 语言 到 ISA3 层 语言 的 翻 
译 工作 。 这 个 图 展示 了 到 第 3 层 的 翻译 ， 有 些 编译 器 是 从 
第 6 层 翻译 到 第 $ 层 ， 然 后 再 要 求 从 第 5 层 翻 译 到 第 3 层 。 5 


2.1.1 C++ 编译 希 4 


为 了 执行 本 书 中 的 程序 ， 需 要 有 一 个 C++ 编译 需 。 3 
运行 程序 分 为 3 个 步骤 : 
e 在 文本 编辑 器 中 用 C++ 语言 写 程序 ， 这 个 版 本 叫 
作 源 程序 。 l 
e 调用 编译 器 把 源 程序 从 C++ PE ak San FEA OLA hT 图 2-1 编译 器 的 功能 ， 把 用 第 6 层 
言 ， 机 器 语言 的 版 本 叫 作 目标 程序 。 语言 编写 的 程序 翻译 为 等 价 
e 执行 目标 程序 。 的 、 较 低层 语言 描述 的 程序 
有 些 系 统 允 许 用 一 条 命令 去 指定 后 面 的 两 个 步骤 ,通常 叫 作 “运行 ”命令 。 无 论 是 否 分 
开 编 译 和 执行 ，HOL6 层 的 程序 在 执行 前 必须 进行 翻译 。 
当 你 写 源 程序 时 ， 它 像 其 他 文本 文档 一 样 保存 在 磁盘 文件 中 。 编 译 器 将 生成 另 一 个 称 为 
代码 文件 的 目标 程序 文件 。 编 译 后 目标 程序 在 你 的 文件 目录 中 是 否 可 见 取决 于 你 的 编译 需 。 
如 果 想 执行 一 个 之 前 编译 过 的 程序 ， 就 不 需要 再 翻译 它 ， 只 需 直 接 执行 目标 程序 即 可 。 
如 果 删 掉 了 磁盘 上 的 目标 程序 ， 总 是 可 以 通过 再 编译 源 程序 来 恢复 它 。 但 是 翻译 只 能 从 高 层 到 
低层 ， 如 果 删 除了 源 程序 ， 那 么 不 能 从 目标 程序 恢复 它 。 





C++ 编译 器 是 软件 ， 不 是 硬件 。 它 存储 在 磁盘 上 的 。 输入 处 理 输出 
文件 中 。 像 所 有 的 程序 一 样 ， 编 译 器 有 输入 、 处 理 和 生 
成 输出 这 3 个 过 程 。 从 图 2-2 中 可 以 看 到 编译 器 的 输入 是 

源 程序 ， 而 输出 是 目标 程序 。 图 2-2 编译 器 是 一 个 程序 
21.2 机 器 无 关 性 


ISA3 层 语 言 是 与 机 器 相关 的 。 使 用 ISA3 层 语 言 写 的 用 于 在 X 品牌 计算 机 上 执行 的 程 


序 ， 是 不 能 在 Y 品牌 计算 机 上 运行 的 。HOL6 层 语 言 的 一 个 重要 性 质 就 是 它们 与 机 器 无 关 。 
WRH HOL6 层 语 言 写 了 一 个 程序 用 于 在 和 X 品牌 计算 机 上 执行 ,那么 只 用 稍 加 修改 ， 它 就 


Y 品 牌 的 
CHITE RE 





可 以 在 Y 品牌 计算 机 上 运行 。 
图 2-3 展示 了 了 C++ 怎样 实现 它 的 机 顺 无 关 性 。 假 设 用 C++ 写 了 一 个 做 统计 分 析 的 应 用 
给 有 立 品牌 计算 机 的 人 。 只 有 当 这 个 统计 程序 是 机 器 语 
言 格式 时 才能 执行 。 因 为 机 器 语言 是 与 机 器 相关 的 ， 所 以 
a i Xan AY 
为 C++ 是 一 种 常用 的 高 级 语言 ， 所 以 应 该 有 X 品牌 机 器 
的 C++ 编译 器 和 YY 品牌 机 器 的 C++ 编译 器 。 如 果 这 样 的 
成 多 品牌 机 更 语 言 版 本 ， 在 男 一 台 机 占 上 调用 YY 品牌 的 
C++ 编译 器 生成 立 品牌 机 器 语言 版 本 ， 而 只 需 写 一 个 C++ 


程序 。 既 想 把 它 卖 给 有 X 品牌 计算 机 的 人 ， 也 想 把 它 卖 

需要 2 个 机 器 语言 的 版 本 : X 品牌 一 种 ,Y 品牌 一 种 。 因 

话 ， 那 么 只 需 在 一 台 机 器 上 调用 X 品 牌 的 C++ 编 主 器 生 i 

程序 。 图 2-3 HOL6 层 语言 的 机 器 无 关 性 ”GG 





2.1.3 C++ 的 内 存 模 型 


C++ 编程 语言 有 3 种 不 同类 型 的 变量 : 全 局 变量 、 局 部 变量 和 动态 分 配 变 量 。 变 量 的 值 
存储 在 计算 机 的 主 存 中 ,但 是 变量 存储 的 方式 取决 于 变量 的 类 型 。3 种 类 型 的 变量 分 别 对 应 
FE aE 3 个 特定 的 区 域 : 

e 全 局 变量 存放 在 存储 句 中 的 固定 位 置 。 

@ 局 部 变量 存放 在 运行 时 栈 上 。 

© 动态 分 配 变量 存放 在 堆 上 。 

全 局 变量 的 声明 在 所 有 了 郑 数 的 外 面 ， 在 程序 的 执行 过 程 中 位 置 保持 不 变 。 局 部 变量 在 于 
数 中 声明 ， 郴 数 被 调用 时 它们 出 现 ， 函 数 结 束 时 它们 消失 。 动 态 分 配 变量 随 着 new 运算 符 
的 执行 出 现 ， 随 着 delete 运算 符 的 执行 消失 。 

栈 是 一 个 值 的 容器 ， 通 过 压 和 人 (push) 操作 存 人 值 ， 通 过 弹出 (pop) 操作 取出 值 。 存 人 
和 取出 值 的 原则 是 后 进 先 出 ， 即 当 从 栈 中 弹出 一 个 值 时 ， 取 出 的 是 最 后 一 个 进入 栈 的 值 。 正 
因 如 此 ， 有 时 候 栈 称 为 LIFO #, LIFO Æ “Last In, First Out”( 后 进 先 出 ) 的 首 字母 缩写 。 

每 条 执行 的 C++ 语句 是 一 个 函数 的 一 部 分 。C++ 图 数 有 一 个 返回 类 型 、 一 个 名 字 和 一 
个 参数 表 。 程 序 包 括 一 个 名 为 main 的 特殊 函数 。 通 过 执行 main 函数 中 的 语句 来 执行 程序 。 
main 基数 中 的 语句 有 可 能 调用 另 一 个 图 数 。 当 执行 一 个 六 数 时 ， 按 照 如 下 顺序 对 运行 时 栈 
的 空间 进行 分 配 : 

© 压 入 返回 值 的 存储 空间 。 

e 压 人 参数 。 

e 压 人 返回 地 址 。 

e 压 人 局 部 变量 的 存储 空间 。 

当 果 数 结束 时 ， 按 照相 反 的 顺序 释放 运行 时 栈 的 存储 空间 : 

e 释放 局 部 变量 。 

e 弹出 返回 地 址 ， 根 据 返回 地 址 确定 要 执行 的 下 一 条 语句 。 

e 释放 参数 。 
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e 弹出 返回 值 ， 按 照 调用 语句 指定 方式 进行 使 用 。 

不 管 一 个 函数 是 main 函数 ， 还 是 在 另 一 个 函数 中 被 一 条 语句 调用 的 函数 ， 和 都 会 执行 上 

本 章 的 程序 说 明 C++ 编程 语言 的 内 存 模型 。 后 面 的 章节 将 展示 编译 器 把 同样 的 程序 翻 
译 到 Asmb5 层 后 的 目标 代码 。 


2.1.4 全 局 变量 和 赋值 语句 


每 个 C++ 变量 有 3 个 属性 : 

e 名 字 。 

e 类 型 。 

e 值 。 

变量 名 是 程序 员 任 意 确 定 的 标识 符 。 变 量 类 型 指定 变量 值 的 可 能 类 型 。 图 2-4 展示 的 程 
序 声明 了 两 个 全 局 变量 ， 输 入 它们 的 值 ， 对 它们 的 值 进 行 操 作 ， 然 后 输出 结果 。 这 个 程序 没 
有 实际 的 意义 ， 它 的 唯一 目的 就 是 说 明 C++ 程序 的 一 些 特点 。 

图 2-4 的 前 两 行 是 注释 ， 编 译 器 会 忽略 注释 。C++ 源 程序 中 的 注释 以 两 条 斜 杠 // 开始 直 
到 本 行 结束 。 程 序 接 下 来 的 一 行 是 

#include <iostream> 
它 是 一 个 编译 髓 指令 (compiler direc- 
tive)， 使 得 程序 能 够 使 用 函数 库 。 在 
这 个 合子 中 ， 库 文件 iosteam BLARE |111 destream 
序 后 面 要 用 到 的 输入 函数 >> ALT HH PR 
数 <<。 所 有 要 使 用 >> 和 << 的 程序 都 OT eM 
需要 这 条 指令 或 者 类 似 的 指令 。 语 名 


using namespace std; 


// Stan Warford 
// A nonsense program to illustrate global variables. 


int main () { 

cin >> ch >> ùj: 
是 使 用 标识 符 cin Al cout 所 必需 的 ， dt By 
Š = cht; 
这 两 个 标识 符 是 在 namespace std cout << ch << end] << j << endl; 
中 定义 的 。 如 果 不 用 using 语句 ， 使 return 0: 
FA cin 和 cout 时 就 必须 用 完全 限 
定名 (fally qualified name). 例 如 ， 
main() 中 的 第 一 行 就 会 写作 


std::cin >> ch >> j: 





程序 中 接 下 来 的 两 行 
char ch; 图 2-4 HOL6 层 和 AsmbS 层 的 全 局 变量 赋值 语句 
int jg 


声明 了 两 个 全 局 变量 。 第 一 个 变量 的 名 字 是 ch， 它 的 类 型 是 字符 型 ， 是 由 变量 名 前 面 的 关 

F char 来 指定 的 。 和 大 多 数 变量 一 样 ， 声 明 并 不 能 确定 它 的 值 ， 而 必须 从 一 个 输入 语句 

获得 值 。 第 二 个 变量 的 名 字 是 j， 类 型 是 整 型 ， 由 int 指定 。 每 个 C++ 程序 都 有 一 个 包含 

可 执行 语句 的 主 函 数 。 在 图 2-4 中 ， 因 为 变量 是 在 主 程序 外 声明 的 ， 所 以 它们 是 全 局 变量 。 
程序 中 接 下 来 的 一 行 


int main () { 


声明 了 主 程序 是 一 个 返回 一 个 整数 的 函数 。C++ 编译 器 必须 生成 能 在 特定 操作 系统 上 执行 的 
代码 ， 由 操作 系统 来 解释 返回 值 。 标 准 惯 例 是 ， 返 回 值 为 0 表示 程序 执行 中 没有 发 生 错 误 。 
如 果 发 生 了 执行 错误 ， 则 程序 中 断 ， 然 后 返回 一 些 非 零 的 值 ， 不 会 执行 到 main() 最 后 一 条 
可 执行 语句 。 这 种 情况 下 ， 如 何 处 理 取决 于 操作 系统 和 错误 的 类 型 。 本 书 中 所 有 的 C++ 程 
序 都 遵循 通常 的 惯例 : 返回 0 作为 main 图 数 的 最 后 一 条 可 执行 语句 。 

图 2-4 中 第 一 条 可 执行 语句 是 

Cin >> CH >> J: 

这 条 语句 用 输入 运算 符 >> 连接 cin, cin 表示 标准 输入 设备 。 标 准 输入 设备 可 以 是 键 
盘 或 者 磁盘 文件 。 在 UNIX 环境 下 ， 默 认 的 输入 设备 是 键盘 。 执 行程 序 时 ， 可 以 把 输入 重 定 
癌 到 一 个 磁盘 文件 。 这 条 输入 语句 把 输入 流 中 的 第 一 个 值 赋 给 ch， 第 二 个 值 赋 给 j。 

第 二 条 可 执行 语句 是 : 

3 

C++ 中 的 赋值 运算 符 是 =， 在 英语 中 读 作 “ gets”( 意 为 获得 ， 在 中 文 里 一 般 读 作 “等 
于 ”)。 上 面 这 条 语句 和 下 面 这 条 是 等 价 的 : 

j=j+5; 
英文 中 读 作 “j gets j plus five” (ÈX j 的 值 为 了 加 上 5 )。 

和 茶 些 编程 语言 不 同 ，C++ 把 字符 当做 整数 ， 可 以 对 它们 进行 运算 。 下 面 这 条 可 执行 
语句 

chr? 
用 增 量 运算 符 对 ch 加 1， 它 等 价 于 赋值 语句 

ch = ch + 1; 

C++ 编程 语言 是 C 语言 〈 它 本 身 是 从 B 语言 发 展 而 来 ) 的 一 个 扩展 。 语 言 设 计 者 在 确定 
C++ 这 个 名 字 时 ， 就 使 用 了 增 量 运 算 符 。 

接 下 来 的 可 执行 语句 是 

cout << ch << endl << j << endl; 
这 条 语句 用 输出 运算 符 << 连接 cout, cout 表示 标准 输出 设备 。 标 准 输 出 设备 可 以 是 显示 
屏 也 可 以 是 磁盘 文件 。 在 UNIX 环境 下 ， 默 认 的 输出 设备 是 显示 屏 ， 执 行程 序 时 ， 可 以 把 输 
出 重 定向 到 一 个 磁盘 文件 。end1 代表 “end line” ( 意 为 行 结束 )。 这 条 输出 语句 把 变量 ch 
的 值 传送 到 输出 设备 ， 然 后 把 光标 移 到 下 一 行 的 开始 位 置 ， 把 变量 j 的 值 传送 到 输出 设备 ， 
下 把 光标 移 到 下 一 行 的 开始 位 置 。 

图 2-5 展示 了 图 2-4 所 示 程 序 在 结束 前 的 内 存 模型 。 "EJ MPERA 
全 局 变量 ch 和 j 的 存储 位 置 是 在 内 存 的 固定 位 置 上 分 配 Tag [a pes 
的 ， 如 图 2-5a 所 示 。 7 

记 住 ， 当 一 个 函数 被 调用 时 ， 运 行 时 栈 上 分 配 了 4 ERE bistik 
项 : 返回 值 、 参 数 、 返 回 地 址 和 局 部 变量 。 由 于 这 个 程序 图 2-5 图 2-4 所 未 程 序 的 内 存 模型 
的 主 函 数 没有 参数 和 局 部 变量 ， 所 以 在 运行 时 栈 上 仅 分 配 了 标记 为 retval 的 返回 值 和 标记 
为 retAddr 的 返回 地 址 的 存储 空间 ， 如 图 2-5b 所 示 。 图 中 显示 的 返回 地 址 值 是 ra0， 这 是 
操作 系统 中 程序 结束 时 将 执行 的 指令 的 地 址 。 对 在 HOL6 层 的 我 们 来 说 ，OS4 层 操 作 系 统 的 
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全 局 变量 在 主 存 中 的 固定 位 置 进行 分 配 ， 而 局 部 变量 在 运行 时 栈 上 进行 分 配 。 在 C++ 
程序 中 ， 局 部 变量 在 主 程序 内 声明 。 图 2-6 所 示 的 程序 声明 了 一 个 常量 和 3 个 局 部 变量 ，3 
个 局 部 变量 分 别 表 示 一 门 课程 的 两 次 考试 分 数 和 一 NA att 
个 总 分 ， 总 分 是 两 次 考试 分 数 的 平均 分 加 上 奖励 分 。 using namespace std; 

第 一 个 变量 之 前 的 是 常量 bonus。 与 变量 一 aaa a 
样 ， 常 量 有 名 字 、 类 型 和 值 。 不 过 ， 与 变量 不 同 gonst int darus = 5% 

的 是 ， 常 量 的 值 不 会 改变 。 初 始 化 运算 符 = 将 这 Wh exami; 


int exam2; 
个 常量 的 值 指定 为 5。 Saks pisos 
图 2-6 中 的 第 一 条 可 执行 语句 是 cin >> examl >> exam2; 
score = (examl + exam2) / 2 + bonus; 
cin >> examl >> exam; cout << "score = " << score << endl; 


它 把 输入 流 中 的 第 一 个 值 赋 给 exam1， 第 二 个 值 gis 
th exam2。 第 二 条 可 执行 语句 是 

score = (examl + exam2) / 2 + bonus; 
它 把 examl 和 exam2 的 值 相 加 得 到 的 和 除 以 2 
获得 它们 的 平均 值 ， 再 加 上 奖励 分 ， 接 者 把 这 个 
值 赋 给 变量 score。 因 为 examl1、exam2 和 2 都 
是 整数 ， 所 以 除法 运算 符 / 代表 整数 除法 。 如 果 图 2-6 处 理 3 个 局 部 整 型 值 的 C++ 程序 
examl 和 exam2 二 者 之 一 被 声明 为 浮 点 型 ， 或 者 
除数 写作 2.0 而 不 是 2， 那么 除法 运算 符 就 代表 浮 点 数 除 法 。 整 数 除 法 会 截 掉 余数 ， 而 浮 点 
数 除法 会 保留 小 数 部 分 。 

例 2.1 如 果 图 2-6 所 示 程 序 的 输入 是 


score = 8l 





68 85 
那么 输出 仍然 是 

score = 81 

考试 分 数 和 是 153。 如 果 用 153 除 以 2.0， 得 到 浮 点 数值 76.5。 但 是 ， 如 果 用 153 除 以 
2， 运 算 符 /代表 整数 除法 ， 小 数 部 分 被 截 掉 ， 或 者 说 砍 掉 ， 得 到 76。 口 


例 2.2 如 果 把 score 声明 为 双 精 度 浮 点 型 ， 如 下 所 示 

double score; 
并 且 如 果 通 过 将 2 改 为 2.0 把 除法 强制 为 浮 点 
数 除法 ， 如 下 所 示 

score = (examl + exam2) / 2.0 + bonus; 
那么 当 输 入 是 68 和 85 时 ， 输 出 是 

score = 81.5 C] 

两 个 数 的 浮 点 除法 仅 生成 一 个 值 ， 即 商 。 
然而 ， 整 数 除法 生成 两 个 值 一 一 商 和 余数 ， 两 
者 都 是 整 型 。 可 以 用 C++ 的 模 运 算 符 % 计算 整 图 2-7 一 些 整 数 除 法 和 模 运 算 的 例子 





型 除法 的 余数 。 图 2-7 展示 了 一 些 整 型 除法 和 模 运 算 的 例子 。 
图 2-8 展示 了 图 2-6 所 示 程 序 中 的 局 部 变量 的 内 

存 模型 。 计 算 机 在 运行 时 栈 上 给 所 有 的 局 部 变量 分 配 

存储 空间 。 当 main() 执行 时 ， 返 回 值 、 返 回 地 址 、 ami aa bani 


score 





局 部 变量 (examl, exam2 Ail score) 被 压 人 栈 中 。 retaddr retAddr 

因为 bonus 不 是 变量 ， 所 以 它 不 会 人 栈 。 retVal retVal 

22 ”控制 流 ) 输入 语句 执行 之 前 b 输 入 语句 执行 之 后 
图 2-8 ”图 2-6 所 示 程 序 中 的 局 部 变量 的 


程序 是 按照 一 条 语句 接着 一 条 语句 的 方式 顺序 执 内 存 模型 
行 的 。 有 两 种 方式 可 以 改变 控制 流 ， 进 而 改变 程序 顺 
F: 选择 和 循环 。C++ 有 if Al switch HAAPE, while, do 和 for 语句 用 于 循环 。 
每 一 条 语句 都 执行 一 个 可 能 改变 控制 流 顺 序 的 测试 。 最 常见 的 测试 是 用 图 2-9 所 示 的 6 种 
关系 运算 和 人 之 一 进行 的 。 


2.2.1 if/else 语句 


图 2-10 给 出 了 一 个 C++ if 语句 的 简单 用 法 ， 用 大 于 或 等 于 关系 运算 符 >= 执行 测试 。 程 
序 输入 整 型 变量 num 的 值 ， 然 后 把 它 和 整 型 常量 1imit 进行 比较 ， 如 果 num 的 值 大 于 或 等 于 
limit 的 值 (100 )， 则 输出 单词 nigh， 否 则 输出 low. 没有 else 部 分 的 if i 理 句 是 合法 的 。 

可 以 用 图 2-11 所 示 的 布尔 运算 符 把 数 个 关系 测试 结合 起 来 。 两 个 8 号 (&&) Æ AND 运 
AFF, PAS EA (||) 是 OR RT, 惊叹 号 (1!) Æ NOT 运算 符 。 


#include <iostream> 
using namespace std; 


int main () { 
const int limit = 100; 
int num; 
cin >> num; 
if (num >= limit) { 
cout << “high"; 
} 


else { 

cout << ™ 
} 
return 0; 





图 2-9 关系 运算 符 图 2-10 C++ if 语句 图 2-11 布尔 运算 符 
例 2.3 如果 年 岭 、 收 入 和 缴 税 是 整 型 变量 ，if 语句 


if ((age < 21) && (income <= 4000)) { 
tax = 0; 
} 
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表示 ， 如 果 年 龄 小 于 21 且 收 入 少 于 $4000， 则 缴 税 值 设 置 为 0。 口 
在 图 2-10 中 的 if 语句 ， 每 个 选择 只 有 一 条 语句 。 如 果 在 一 个 选择 中 需要 执行 多 于 一 条 
的 语句 ， 那 就 必须 用 花 括 号 {} 把 这 些 语句 括 起 来 ， 否 则 括号 是 可 选 的 。 
例 2.4 图 2-10 中 的 if 语句 可 以 这 样 写 


if (num >= limit) 
cout << “high"; 


else 
cout << "low"; 
输出 语句 不 用 花 括 号 括 起 来 。 口 


2.2.2 switch 语句 


图 2-12 中 的 程序 使 用 C++ 的 switch 语句 
和 用 户 玩 一 个 竞猜 小 游戏 ， 要 求 用 户 挑 一 个 数 | int main O { 


#Hinclude <iostream> 
using namespace std; 


A int guess; 
字 ， 然 后 根据 输入 的 数字 输出 相应 的 消息 。 cout << “Pick a number 0..3: " 
也 可 以 用 if 语句 获得 和 switch 语句 相同 的 结 cin >> guess; 
eE . 五 TAU sao Er switch (guess) { 
Ñ, 然而 等 价 的 if 语句 不 如 switch 语句 效率 高 。 case 0: cout << "Not close"; break; 
例 2.5 图 2-12 PAWN switch 语句 可 以 用 逻 case 1: cout << "Close"; break; 
LL bos 2 五 case 2: cout << “Right on"; break; 
tE Ey REY if 语句 写 为 case 3: cout << “Too high"; 
if (guess == 0) { 
cout << "Not close"; cout << endl; 
} . return 0; 
else if (guess == 1) { } 
cout << "Close"; 交互 的 输入 / 输出 
} 


Pick a number 0..3: 1 


else if (guess == 2) { Close 


cout. << "Right on”; 
} | 图 2-12 C++ switch 语句 
else if (guess == 3) { 

cout << "Too high"; 





#include <iostream> 
然而 ， 这 个 代码 不 如 switch 语句 效率 高 。 有 
使 用 这 个 代码 ， 如 果 用 户 猜 3; 那么 所 有 4 个 测 char letter; 
试 都 要 执行 。 使 用 switch 语句 ， 如 果 用 户 猜 3， ean Gd 
程序 直接 跳 到 “ Too high” 语 句 ， 而 不 必用 0、1 nS in 
和 2 与 guess 比较 。 while (letter I= '*') { 
cout << letter; 
, cin >> letter; 
2.2.3 while 循环 
图 2-13 中 的 程序 是 一 个 没有 什么 实际 意义 eerie 


的 程序 ， 它 唯一 的 目的 是 说 明 C++ AY while tA 
环 。 程 序 的 输入 是 以 星 号 (*) 结尾 的 一 个 字符 
串 ， 输 出 不 包括 星 号 的 所 有 字符 。 有 经 验 的 C++ 
程序 员 不 会 用 这 个 技巧 。 图 2-13 和 本 章 中 所 有 的 
i 程序 都 是 为 了 在 后 面 的 章节 中 能 够 对 它们 在 更 低 
44| 的 抽象 层次 上 进行 分 析 。 图 2-13 C++ while 循环 
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在 进入 循环 前 ， 程 序 给 全 局 变量 letter 输入 第 一 个 字符 的 值 。 语 名 
while (letter != '*') 
letter 的 值 和 皇 号 字符 进行 比较 。 如 果 它 们 不 相等 ， 那 么 执行 循环 体 ， 输 出 这 个 字符 ， 然 
后 输入 下 一 个 字符 。 接 着 ， 控 制 流 返 回 到 循环 顶部 的 条 件 判 断 。 
如 果 letter 是 局 部 变量 而 不 是 全 局 变量 ， 那 么 程序 的 输出 还 是 一 样 。 把 变量 声明 为 全 
局 的 还 是 局 部 的 是 一 个 软件 设计 问题 。 经 验 法 则 是 : 总 是 把 变量 
声明 为 局 部 变量 ， 除 非 有 很 好 的 原因 不 这 么 做 。 局 部 变量 能 增 | #include <iostream> 
强 软件 系统 的 模块 性 ， 让 长 程序 更 容易 阅读 和 调试 。 图 2-4 和 | “STDS "space std: 
图 2-13 中 的 全 局 变量 不 代表 好 的 软件 设计 。 以 这 种 方式 呈现 是 | int cop; 
为 了 说 明 C++ 的 内 存 模 型 。 后 面 的 章节 会 展示 C++ 编译 器 怎样 | ver 


翻译 本 章 中 给 出 的 程序 。 int main () { 
cop = 0; 
2.2.4 do 循环 siei = 40; 
图 2-14 中 的 程序 说 明 do 语句 的 使 用 。 这 个 程序 比较 特殊 ， oe an 
因为 它 没有 输入 ， 每 次 程序 执行 都 生成 同样 的 结果 。 这 也 是 一 个 ) 


没有 实际 意义 程序 ， 只 是 为 了 说 明 控制 流 。 gd TERE K SERRE Ts 
一 个 警官 的 初始 位 置 在 0 单位 处 ， 然 后 开始 追 一 个 初始 位 置 | COS co! 
在 40 单位 的 司机 。 每 执行 循环 体 一 次 代表 一 个 时 间 间 隔 ， 在 此 
期 间 ， 和 警官 行进 25 个 单位 ， 司 机 行进 20 个 单位 。 语 名 
cop += 25; 
是 C++ 中 语句 
cop = cop + 25; 
MASER. #include <iostream> 
与 图 2-13 中 的 循环 不 一 样 ，do 语句 是 在 | using namespace std; 
循环 的 底部 进行 测试 ， 因 此 循环 体能 保证 至 





图 2-14 C++ do 循环 


int main () { 


少 被 执行 一 次 。 当 执 行 语句 int vector[4]; 
while (cop < driver); int j; 
for ¢j ~ D: J S 4¢ g++) { 
执行 时 ， 它 比 较 cop 的 值 和 driver 的 cin >> vector[j]: 


值 。 如 果 cop 小 于 driver， 则 控制 流转 到 


for (j = 3; j >= 0; j--) { 


do, 于 是 循环 体重 复 。 cout << j << ' ' << vector[j] << endl; 


} 
2.2.5 数组 和 for 循环 return 0: 


图 2-15 中 的 程序 用 来 说 明 for 循环 和 
数组 。 程 序 分配 了 一 个 4 个 整数 的 局 部 数组 ， 
把 值 输入 数组 ， 然 后 以 相反 的 顺序 输出 值 。 

语句 

int vector[4]; 
声明 变量 vector ， 该 变量 是 一 个 由 4 个 整数 
组 成 的 数组 。 在 C++ 中， 所 有 数组 的 第 一 个 图 2-1$ C++ 数组 for 循环 
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索引 都 是 0。 因 此 ， 这 个 声明 为 数组 元 素 

vector[0] vector[1] vector[2] vector[3] 
分 配 存储 空间 。 

声明 中 的 数字 指定 要 分 配 多 少 个 元 素 ， 它 总 是 比 最 后 一 个 元 素 的 索引 大 1。 在 这 个 程序 
中 ， 元 素 个 数 是 4， 比 最 后 一 个 元 素 的 索引 3 大 1。 

每 个 for 语句 有 一 对 圆 括号 ， 它 里 面 分 为 3 个 部 分 ， 各 部 分 之 间 用 分 号 隅 开 。 第 一 个 
部 分 赋 初 值 ， 第 二 个 部 分 是 测试 ， 第 三 个 部 分 是 增 量 递增 。 在 这 个 程序 中 ，for 语句 

for G = 0; J < a Jre) 
中 ，j=0 是 赋 初 值 ，j<4 是 测试 ，j++ 是 递增 。 

当 程 序 进 入 循环 时 ，j 设置 为 0， 因 为 测试 在 循环 的 顶部 ， 所 以 j 的 值 和 4 进行 比较 。 
由 于 j 小 于 4， 所 以 循环 体 


cin >> vector[j]; 


执行 。 输 入 流 中 的 第 一 个 整数 值 被 读 人 v[0]。 控 制 返 回 到 for 语句 ， 因 为 第 三 个 部 分 的 表 
达 式 是 j++, HA j 递增 1。 接 着 j 的 值 和 4 比较 ， 重 复 处 理 过 程 。 

递减 表达 式 

i> 


是 C++ 中 j=j-1 的 缩写 ， 所 以 第 二 个 循环 是 以 相反 的 顺序 打印 值 。 


2.3 mA 


C++ 有 两 种 盟 数 : 一 种 返回 值 为 空 ， 男 一 种 返回 值 为 非 空 类 型 。 孙 数 main() 返回 整 
型 ， 不 是 空 值 。 操 作 系 统 根据 这 个 整数 来 确定 程序 是 否 正常 结束 。 返 回 值 为 空 的 吨 数 (简称 
78 PRL) 完成 处 理 ， 不 返回 任何 值 。 返 回 值 为 空 的 函数 的 常见 用 法 是 输入 或 输出 一 组 值 。 


2.3.1 空 函 数 和 传 值 调用 的 参数 


图 2-16 中 的 程序 使 用 空 也 数 打印 一 个 数值 的 柱状 图 。 程 序 把 第 一 个 值 读 入 整 型 变量 
numpPts。 在 主 程序 中 ， 全 局 变量 j 控制 for 循环 执行 numPts 次 。 每 次 执行 循环 都 调用 空 
PK% printbar。 图 2-17 展示 了 图 2-16 中 程序 开始 执行 时 的 轨迹 。 

当 调 用 一 个 空 函数 时 ， 运 行 时 栈 中 的 分 配 按照 以 下 顺序 进行 : 

e 压 入 实际 参数 (简称 实 参 )。 

e 压 人 返回 地 址 。 

e 压 人 局 部 变量 的 存储 空间 。 

图 2-17e 是 图 2-16 所 示 程 序 分 配 过 程 的 开始 ， 程 序 压 人 形式 参数 (简称 形 参 ) n 的 值 
value。 在 图 2-17f 中， 压 人 返回 地 址 。 图 2-17g 中 压 人 局 部 变量 的 存储 空间 。 分 配 过 程 完 
成 后 ， 列 表 中 的 最 后 一 个 局 部 变量 k 在 栈 的 顶部 。 

被 压 人 运行 时 栈 的 所 有 项 目的 集合 称 为 栈 帧 (stack frame) 或 活跃 记录 (activation 
record) 。 在 图 2-16 WERFF, AZ RAIER WH 3 项 组 成 : mn、 返回 地 址 和 k。 图 中 用 ral 
标识 的 返回 地 址 是 主 程序 中 for 语句 结束 处 的 地 址 。main 基数 的 栈 帧 由 两 项 组 成 : 返回 值 
和 返回 地 址 。 

空 困 数 打印 柱状 图 的 一 根 柱 子 后 ， 控 制 返回 到 主 程序 。 运 行 时 栈 上 的 项 目 按照 与 分 配 顺 
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序 相反 的 顺序 进行 释放 。 过 程 如 下 : 
o 释放 局 部 变量 的 存储 空间 。 
e 弹出 返回 地 址 。 
e 释放 实 参 。 


#include <iostream> 
using namespace std; 


int numPts; 
int value; 
TAG. es 


void printBar (int n) { numPoints numPoints EJ 
int k; value retAddr value TE retAddr 
for (k= 1; k <= n; k++) { : 
cout << '*'; J ‘MM FESTA j o oh retVal 


] 
cout << endl; a) 开始 b) cin >> ee 


} 
numPoints numPoints 
int main () { DR retAddr retAddr 
cin >> numpPts : iii value 
for (j = 1; j <= numPts; j++) { j EE oe retVal j gE me: retVal 


cin >> value; 





printBar (value); c) for(j =1; j < mornin jtt) d) cin >> nae 
} // ral 
return 0; 
numPoints : numPoints 
value s value 
J j 
KKKK KKK KKK f) FE AGE 回 地 址 
KEEKKKKK KK KKK 
KKK K IKK KKK KKK KKK KKK KK KKK KKK KKK KKK 
KKK KEKKKK KKK KKK KKK KKK KKK 
KKKKKK KK KKK KKK KKK KKK 
KKEKKKKK KKK KKK KKK KKK KKK . numPoints 
KKEKKKKKEEKKKK KKK KKK KKK KKK KEE 
-eaeeeeeeeeeaea as & 2 value 
KKKKKK KKK j 
ts 
*x* 
g) 压 人 局 部 变量 k 的 存储 空间 
oS Pimat -一 ”一 
图 2-16 打印 柱状 图 的 程序 。 该 空 图 2-17 图 2-16 所 示 程 序 的 运行 时 栈 


盟 数 打印 一 根 柱子 


程序 通过 返回 地 址 知道 ， 在 执行 完 空 函数 的 最 后 一 条 语句 后 ， 接 下 来 去 执行 主 程序 中 的 
哪 条 语句 。 在 主 程序 代码 中 ， 那 条 语句 被 标识 为 ral， 是 过 程 调用 后 面 的 一 条 语句 。 


2.3.2 ”函数 的 例子 


图 2-18 中 的 程序 用 哺 数 计算 一 个 整数 的 阶乘 值 。 程 序 提示 用 户 输入 一 个 小 的 整数 ， 把 
它 作 为 参数 传递 给 哨 数 fact. 

图 2-19 展示 了 图 2-18 PRR ACE, KBR KB He. K 2-19c 表明 首先 
压 人 返回 值 的 存储 空间 。 图 2-19d 展示 压 人 形 参 n 的 值 num。 图 2-19e 中 压 人 返回 地 址 。 
图 2-19f 和 g 压 人 局 部 变量 f 和 j 的 存储 空间 。 
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XP PARA RIA 5 项 。 图 中 标记 为 ral 的 返回 地 址 表示 主 程序 中 cout 语句 的 地 址 。 
控制 从 该 消 数 返回 到 调用 该 函数 的 语句 (简称 调用 语句 )。 这 与 空 函数 是 不 同 的 ， 在 空 函 数 
的 调用 中 ， 控 制 是 返回 调用 语句 后 面 的 那 条 语句 。 


#include <iostream> 
using namespace std; 


int num; 


int fact (int n) { 
int fe 23 
f= l; 
for (J = 1; j <= n; j+) { 
Y Pe 92 
} 
return f; 
} 


int main () { 
cout << “Enter a small integer: "; 
cin >> num; 
cout << “Its factorial is: " << fact (num) << endl; // ral 
return 0; 
} 


交互 式 输入 / 输出 


Enter a small integer: 3 
Its factorial is: 6 





图 2-18 A pT ET He AY Ee 








retVal 


Pi retAddr ra0 | retAddr 
retAddr 
num [| | ae retVal num | 3 | Lod retVal sum | 3 | | 3 | 
retVal ‘num 3 
4 4 A 
a) 开始 时 b) cin >> num c) 压 入 返回 值 i1 的 存储 空间 d) 压 人 实际 参 


retVal 


retAddr 


retVal num 


e) 压 入 返回 地 址 f) 压 入 局 部 变量 f 的 存储 空间 g) 压 入 局 部 变量 j 的 存储 空 z [a] h) f = 
图 2-19 图 2-18 所 示 程 序 的 运行 时 栈 





2.3.3 传 引 用 调用 的 参数 


前 面 讲述 程序 中 的 过 程 和 函数 都 是 通过 值 传递 参数 的 。 在 传 值 调用 中 ， 形 参 获 得 实 参 的 
值 。 如 果 被 调用 的 过 程 改 变 了 它 的 形 参 值 ， 调 用 过 程 中 相应 的 实 参 值 不 变 。 被 调用 过 程 所 做 


的 任何 改变 都 是 对 运行 时 栈 上 的 值 进行 的 ， 当 栈 帧 释放 后 ， 任 何 被 改变 的 值 也 随 之 释放 。 

如 果 一 个 过 程 意 在 改变 调用 程序 中 实 参 的 值 ， 那 么 就 要 使 用 传 引 用 调用 而 不 是 传 值 调用 。 
在 传 引用 调用 中 , 形 参 获得 的 是 对 实 参 的 一 个 引用 。 如 果 被 调用 过 程 改变 了 它 的 形 参 的 值 ， 
那么 调用 程序 中 相应 的 实 参 也 会 改变 。 要 指定 一 个 参数 为 传 引 用 调用 ， 就 要 在 参数 列表 中 该 
参数 的 类 型 后 加 一 个 & 符号 。 如 果 没 有 这 个 & 符号 ， 编 译 器 会 假定 该 参数 是 传 值 调 用 的 。 

图 2-20 中 的 程序 用 传 引 用 调用 改变 实 参 的 值 。 它 提示 用 户 输入 两 个 整数 ， 排 序 输 入 。 它 
有 一 个 空 图 数 order， 调 用 男 一 个 空 函数 swap。 图 2-21 展示 了 整个 程序 的 分 配 和 释放 的 顺序 。 


#include <iostream> 
using namespace std; 


int. a, D: 


void swap (int& r, int& s) { 
int temp; 
temp = r; 
r= Bs 
s = temp; 
} 


void order (int& x, int& y) { 
1f (x > ¥) g 
Swap (x, y); 
F // ra? 
} 


int main () { 
cout << “Enter an integer: " 
cin >> a; 
_ cout << "Enter an integer: ” 
cin >> b: 
order (a, b); 
cout << "Ordered they are: " << a << ", " << b << endl; // ral 
return 0; 
} 


交互 式 输入 / 输出 


Enter an integer: 6 
Enter an integer: 2 
Ordered they are: 2, 6 





图 2-20 ”对 两 个 数 排序 的 程序 。 空 图 数 使 用 传 引用 方式 传递 参数 


图 2-21c 中 order 的 栈 帧 有 3 项 。 形 参 x Aly 是 传 引 用 调用 的 ， 有 箭头 从 运行 时 栈 上 的 x 
指向 主 程序 中 的 a， 这 表明 x 引用 a。 类 似 地 ， 从 运行 时 栈 上 的 y 指向 主 程序 中 b 的 箭头 表明 
y 引用 b, ral 标识 的 返回 地 址 是 cout 语句 的 地 址 ， 该 语句 在 主 图 数 中 对 order 的 调用 之 后 。 

图 2-21d 中 swap 的 栈 帧 有 4 项 。r 引用 x，x 引用 a， 因 此 r 引用 a。 第 头 从 运行 时 栈 
EM r 指 到 aa， 箭头 同样 从 x 指向 a. FE, ATS MGS TAT RR ERY s 指向 b， 箭 头 同 样 从 
y 指向 b。ra2 标识 的 返回 地 址 是 函数 order 最 后 一 条 语句 的 地 址 。swap 中 的 语句 交换 s 
和 的 值 。 因 为 r 引用 a，s 引用 b， 所 以 它们 交换 的 是 主 程序 中 a All 的 值 。 

当空 函数 结束 时 ， 要 释放 它 的 栈 帧 ， 栈 帧 中 的 返回 地 址 告诉 计算 机 接 下 来 去 执行 哪 条 指 
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令 。 图 2-21e 展示 了 从 空 图 数 swap 返回 的 过 程 ， 释 放 其 栈 帧 。swap 栈 帧 中 的 返回 地 址 告诉 
计算 机 在 释放 该 栈 帧 之 后 | indent ra2 的 语句 。 虽 然 图 2-20 中 的 代码 ra2 处 并 没有 
语句 ， 但 是 空 函 数 结尾 处 隐 含 有 一 个 return 语句 ， 这 在 HOL6 层 是 不 可 见 的 。 

图 2-21f 展示 了 释放 order een order 栈 帧 中 的 返回 地 址 告 人 
栈 帧 之 后 ， 执 行 主 程序 中 的 cout 语句 。 








retAddr 
ag 


Ea retAddr retAddr b i OY 
| [retval I retVal a} 6 | | retval 
I 


a) 开始 时 b) 输 入 a、b c) order(a,b) 






retAddr 


| | retvan | | retval 





etAddr bl 6 | oe ae (ae ra0 | retAddr 


d) swap(x,y) e) 从 swap 返 回 f) Wise 加 
图 2-21 .图 2-20 的 运行 时 栈 
因为 栈 是 LIFO 结构 ， 所 以 在 函数 结束 时 ， 最 后 一 个 被 压 入 运行 时 栈 的 栈 帧 将 第 一 个 被 
弹出 。 因 此 返回 地 址 将 把 控制 返回 到 最 近 的 调用 函数 。 运 行 时 栈 的 LIFO 属性 将 是 理解 2.4 
节 中 递归 的 基础 。 
你 可 能 已 经 注意 到 了 ，main() 是 一 个 总 是 返回 整数 的 函数 ， 截 至 目前 ， 所 有 的 程序 都 
向 操作 系统 返回 0。 此 外， 截至 目前 ， 所 有 的 主 程序 函数 都 没有 参数 。 虽 然 主 程序 有 参数 是 
很 常见 的 , 但 是 本 书 中 的 主 程序 都 没有 。 为 了 保持 图 的 简单 ， 后 面 的 图 中 都 将 省 略 主 程序 的 
relVal 和 retAddr。 实 际 的 C++ 编译 帮 必 须 处 理 这 两 者 。 


2.4 递归 


你 曾 在 字典 中 查找 不 认识 单词 的 定义 时 ， 发 现 字典 恰恰 是 以 男 一 个 不 认识 的 单词 来 定义 
它 的 吗 ? 接着 你 就 查找 第 二 个 单词 ， 发 现 它 是 用 第 一 个 单词 来 定义 的 吗 ? 这 是 一 个 循环 或 间 
接 递 归 的 例子 。 字 典 的 这 个 问题 源 于 从 一 开始 你 就 不 知道 第 一 个 单词 的 意思 。 如 果 第 二 个 单 
词 用 你 认识 的 第 三 个 单词 来 定义 ， 就 能 得 到 满意 的 结果 了 。 

数学 上 ， 郴 数 的 递归 定义 (recursive definition) 是 指 函 数 使 用 它 自己 来 定义 自己 。 例 
如 ,假设 函数 f(n) 定义 如 下 : 

f(n) = nf(n-1) 
硅 用 这 个 定义 来 确定 f(4)， 就 在 定义 中 用 4 代替 n: 
/(4) = 4f(3) 
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但 是 现在 你 不 知道 f(3) 是 什么 ， 那 么 在 定义 中 用 3 RE n, 1498): 
f(3) = 3f(2) 
把 这 个 代 进 f(4) 的 公式 中 ， 得 到 : 
J (4) = 43) f(2) 55 
但 是 ， 现 在 你 不 知道 f(2) 是 什么 ， 定 义 告 诉 你 它 是 2 RAS, BARIA 的 公式 变 为 
J (4) = 4(3)(2)/(1) 
可 以 看 到 这 个 定义 的 问题 没有 什么 能 够 结束 这 个 过 程 ， 你 将 无 穷尽 地 计算 f(4)。 
F(4) = 4(3)(2)(0) (-1)(-2)(-3)... 

这 就 如 同 字 上 典 给 了 你 一 个 无 穷尽 的 定义 串 一 样 ， 每 个 单词 都 基于 男 一 个 你 不 认识 的 单 
词 。 为 了 完整 ,定义 必须 指定 某 个 特定 n 的 f(n) 值 ， 那 么 前 述 过 程 就 能 终止 你 可 以 计算 出 
任何 n 的 f(n)。 

下 面 是 f(n) 的 一 个 完整 递归 定义 : 

f(n) =nf(n-1) n>l 


fl) =1 
这 个 定义 说 明 前 述 过 程 可 以 在 f(1) 停止 。 因 此 , f(4) 是 
f(4) = 41 (3) 
= 4(3)f(2) 
= 4(3)(2)f(1) 
= 4(3)(2)(1) 
一 24 


你 应 该 知道 这 就 是 阶乘 函数 的 定义 。 
2.4.1 阶乘 函数 


C++ 中 的 递归 函数 (recursive function) 是 调用 它 上 自己 的 郴 数 。 没 有 什么 有 新 语法 的 特 
殊 递 归 语 句 需要 学 习 。 它 在 运行 时 栈 上 分 配 存储 空间 的 方法 和 非 递 归 因 数 是 一 样 的 。 唯 一 的 
不 同 是 递归 函数 包括 一 条 调用 它 目 己 的 语句 。 

图 2-22 中 的 函数 递归 地 计算 一 个 数 的 阶乘 ， 它 是 f(n) 递归 定义 的 一 个 直接 应 用 。 


#include <iostream> 
using namespace std; 


int num; 


int fact (int n) { 
if (n <= 1) { 
return 1; 
} 
else { 
return n * fact(n - 1); // ra2 
} 
} 


int main () { 
cout << “Enter a small integer: " 
cin >> num; 





图 2-22 ”递归 计算 阶乘 的 函数 
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cout << "Its factorial is: " << fact (num) << endl; // ral 
return 0; 
} 


交互 式 输入 /输出 


Enter a small integer: 4 
Its factorial is: 24 





图 2-22 ( 续 ) 


图 2-23 给 出 了 简化 的 该 程序 运行 时 栈 的 历史 记录 ， 它 隐藏 了 主 程序 的 栈 帧 。 第 一 个 郴 
数 调用 来 目 主 程序 。 图 2-23c 展示 了 第 一 次 调用 的 栈 帧 ， 返 回 地 址 是 ral， 它 代表 主 程序 中 
cout 调用 的 地 址 。 


nm[ 2] om 


a) 开始 


VALLE 
b) cin>>num 







retAddr 


retVal 
retAddr 





retAddr 













retVal 
retAddr 








num| 4 | retVal retVal 
4 4 4 
d) 调用 fact(3) e) 调用 fact(2) f 调用 fact(1) 

retAddr 
n 

| 1 |retval 
retAddr 

ra2 | retAddr 
n 
n 

retVal 






retAddr 





retAddr 

n 
retVal retVal 
retAddr ws 

retVal retVal 
h) 退回 
retAddr 
retVal 
k) 返回 





图 2-23 图 2-22 Wit Atte 





该 函数 中 第 一 条 语句 测试 n 是 否 为 1。 因 为 n 的 值 是 4， 所 以 执行 else 部 分 。 而 else 
部 分 的 语句 

return n * fact (n - 1) // ra2 
在 返回 语句 的 右边 包含 一 个 对 函数 Fact 的 调用 。 

这 是 一 个 递归 调用 ， 因 为 它 在 函数 里 调用 它 目 己 。 这 个 调用 和 任何 其 他 顺 数 调用 所 做 的 
事情 顺序 是 一 样 的 。 分 配 新 的 栈 帧 ， 如 图 2-23d 所 示 。 第 二 个 栈 帧 中 的 返回 地 址 是 这 个 函数 
中 调用 语句 的 地 址 ， 由 ra2 来 表示 。 

实 参 是 n-1, AFA 2-230 P 的 值 是 4， 所 以 它 的 值 是 3。 形 参 nn 是 传 值 调用 的 ， 因 
此 图 2-23d 顶部 栈 帧 的 形 参 n 赋值 为 3。 

图 2-23d 展示 了 一 个 对 递归 调用 来 说 很 典型 的 奇特 现象 。 图 2-22 的 程序 代码 中 函数 
fact 的 形 参 表 中 只 声明 了 一 个 n， 但 图 2-23d Pn 出 现 了 两 次 。n 的 旧 实 例 从 主 程序 获得 的 
值 4， 而 n 的 新 实例 从 递归 调用 中 获得 值 3。 

计算 机 暂停 该 也 数 旧 的 执行 ， 并 从 头 开始 该 浮 数 的 一 个 新 的 执行 。 该 函数 的 第 一 条 语句 是 
比较 n 是 否 等 于 1， 图 2-23d 中 在 运行 时 栈 上 有 2 个 n， 应 该 比较 哪个 n 呢 ? 规则 是 : 任何 对 
局 部 变量 或 形 参 的 引用 指 的 都 是 项 部 栈 帧 中 的 那个 。 因 为 mn 的 值 是 3， 所 以 执行 el se 部 分 。 

但 是 现在 函数 又 进行 一 次 递归 调用 ， 分 配 第 三 个 栈 帧 ， 如 图 2-23e 所 示 ， 接 着 是 第 四 
个 ， 如 图 2-23f 所 示 。 每 次 调用 ， 最 新 分 配 的 形 参 n 的 值 都 比 卓 值 小 1， 因为 函数 调用 是 

FE 

最 后 ， 如 图 2-23g Pra, n 的 值 为 1 。 该 男 数 给 栈 上 标号 为 retval 的 单元 赋值 为 1, 
跳 过 else 部 分 ， 然 后 终止 。 这 使 得 控制 返回 到 它 的 调用 语句 。 

递归 返回 发 生 的 事情 和 非 递归 返回 是 一 样 的 。retyval 包含 返回 值 ， 返 回 地 址 说 明 接 下 
来 要 执行 哪 条 语句 。 图 2-23g 中 ,retVal 是 1， 返回 地 址 是 该 肾 数 中 的 调用 的 语句 。 释 放 
顶部 栈 帧 ， 调 用 语句 

return n * fact(n - 1) // ra2 
完成 它 的 执行 。 该 语句 将 n 的 值 2 乘 以 返回 值 1， 并 把 这 个 乘积 
赋 给 retVal, fF retval 的 值 就 是 2， 如 图 2-23h 所 示 。 = 

每 次 返回 都 执行 同样 的 事件 序列 。 图 2-23i、j 展示 了 从 第 二 


















A 
次 调用 返回 的 值 6， 而 第 一 次 调用 返回 的 值 是 24。 图 2-24 展示 了 \ 
图 2-22 程序 的 调用 序列 。 主 程序 调用 晒 数 fact, fea A% fact 
调用 它 目 己 3K. ABI, Kýr fact 总 共 被 调用 了 4 次 。 

你 可 以 看 到 ， 程 序 计 算 4 的 阶乘 的 方法 与 从 它 的 递归 定义 
计算 f(4) 的 方法 一 样 。 计 算 f(4) 从 4 乘 以 f(3) 开始 ， 接 着 必须 
暂停 计算 f(4)， 转 而 计算 f(3)。 在 得 到 f(3) 的 值 之 后 ,用 4 乘 


! 2 


T 


















以 它 就 得 到 f(4)。 

类 似 地 ， 程 序 必须 暂停 对 该 函数 的 一 次 执行 ， 青 次 调用 同 
一 个 区 数 。 运 行 时 栈 跟 踪 记 录 变 量 的 当前 值 ， 这 样 当 也 数 实例 
再 继续 时 ， 还 能 使 用 正确 的 变量 值 。 


2.4.2 递归 的 思考 方式 
有 两 种 不 同 的 角度 来 看 竺 递归 : 微观 的 和 宏观 的 。 图 2-23 是 从 微观 的 角度 展示 的 ， 精 


图 2-24 图 2-22 的 调用 序列 。 
Fy Sk K AN PR RL Val 
用 ， 虚 箭头 表示 返 
回 ， 每 个 返回 箭头 
旁边 的 是 返回 值 
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确 地 给 出 了 执行 期 间 计算 机 内 发 生 了 什么 。 它 考虑 的 是 程序 历史 记录 中 运行 时 栈 的 细节 。 宏 
观 的 看 法 不 考虑 单独 的 每 棵 树 ， 它 考虑 的 是 整个 森林 。 

为 了 理解 C++ 怎样 实现 递归 ， 需 要 知道 微观 的 看 法 。 在 学 习 Asmb5 层 怎 样 实现 递归 
时 ， 必 须 了 解 运行 时 栈 的 细节 。 如 果 只 是 想 写 递归 因数 ， 应 该 宏观 而 不 是 微观 地 思考 。 

写 递 归 荫 数 最 难 的 地 方 是 ， 必 须 假设 可 以 调用 正在 写 的 程序 。 为 此 ， 你 必须 忘掉 运行 时 
栈 ， 宏 观 地 思考 。 

数学 归纳 法 证 明 有 助 于 进行 宏观 思考 。 归 纳 法 证 明 的 两 个 关键 元 素 是 

o 建立 基础 。 

e 给 定 n 的 公式 ,证 明 它 对 n 十 1 是 成 立 的 。 

RE, ih eR AY PT ENR E 

o 计算 该 基础 的 因数 。 

e 假设 有 nn-l APRA, Bit n 的 函数 。 

想象 你 正在 写 函 数 fact, BF Six, 


int fact (int n) { 
if (n <= 1) { 
return 1; 
} 
else { 


不 知 该 怎样 写 下 去 了 。 已 经 计算 了 基础 n=1 A eR, (AEE Ri BE A A es A 
fact， 尽 管 还 没有 写 完 这 个 函数 。 必 须 假设 fact(n-1) 将 返回 阶乘 的 正确 值 。 

这 里 是 必须 宏观 思考 的 地 方 。 如 果 开 始 想 知道 fact (n-1) 怎 样 返 回 正确 值 ， 如 果 栈 帧 
开始 在 你 脑 中 跳跃 ， 那么 这 样 的 思考 是 不 对 的 。 在 归纳 法 证 明 中 ， 必 须 假 设 有 n 的 公式 。 同 
H, FES PR fact 时 ， 必 须 假设 能 调用 fact(n-1), HARE. 

递归 程序 是 基于 分 治 策略 的 ， 如 果 能 把 一 个 大 问题 分 解 为 小 问题 从 而 解决 它 时 ， 这 个 策 
略 很 合适 。 每 次 递归 调用 都 使 问题 变 得 越 来 越 小 ， 直 到 程序 到 达 最 小 的 问题 ， 即 基础 ， 基 础 
是 很 容易 解决 的 。 


2.4.3 递归 加 法 


这 里 有 递归 问题 的 另 一 个 例子 。 假 设 11st 是 一 个 整数 数组 ， 想 要 递归 地 求 出 表 中 所 有 
整数 的 和 。 
第 一 步 是 构想 出 以 较 小 问题 来 解决 大 问题 的 解决 方案 。 如 果 知道 怎样 求 出 1ist[0] 和 
1ist[n-1] 之 间 元 素 的 和 ， 可 以 简单 地 把 这 个 和 加 上 1ist[n]， 就 能 得 到 所 有 整数 的 和 。 
第 二 步 是 设计 出 具有 适当 参数 的 函数 。 这 个 函数 通过 调用 它 自 己 计算 n-1 个 整数 的 和 
来 计算 n 个 整数 的 和 。 因 此 参数 表 里 必须 有 一 个 参数 指明 对 数组 中 多 少 个 整数 相 加 。 应 该 得 
到 如 下 的 函数 头 : 


int sum (int a[], int n) { 
// Returns the sum of the elements of a between a[0] and a[n]. 


怎样 建立 归纳 基础 呢 ? 很 简单 ， 如 果 n 等 于 0， 那 么 函数 应 该 把 a[01 和 a[0] 之 间 的 
元 素 求 和 ， 一 个 元 素 的 和 就 是 这 个 元 素 a[0]。 
现在 可 以 写 出 


if (n == 0) { 
return a[0]; 


} 
else { 


现在 ， 宏 观 地 思考 。 假 设 sum(a,n-1) 将 返回 alo] 和 a[n-1] 之 间 所 有 整数 的 和 。 要 有 
信心 ! 需要 做 的 就 是 把 这 个 和 与 a[n] 相 加 即 可 。 图 2-25 展示 了 完成 的 程序 中 的 这 个 函数 。 


#include <iostream> 
using namespace std; 


int list(4]; 


int sum (int af], int n) { 
// Returns the sum of the elements of a between a[0] and a[n]. 
if (n == 0) { 
return a[0]; 
} 
else { 
return a[n] + sum(a, n - 1); // ra2 
} 
} 


int main () { 
cout << “Enter four integers: "; 
cin >> Tist(O] >> ristii >> Tsti2i o> TSt 
cout << “Their sum is: " << sum(list, 3) << endl; // ral 
return 0; 


} 
交互 式 输入 / 输出 


Enter four integers: 3 2 6 4 
Their sum is: 15 





图 2-25 返回 数组 中 前 n SAS ZAI 


尽管 写 这 个 函数 时 没有 从 微观 角度 进行 考虑 ， 但 是 仍然 可 以 跟踪 记录 运行 时 栈 。 图 2-26 
展示 了 对 sum 头 两 次 调用 的 栈 帧 。 栈 帧 由 返回 值 、 人 参数 a 和 n 以 及 返回 地 址 组 成 。 因 为 这 
里 没有 局 部 变量 ， 所 以 运行 时 栈 上 也 没有 为 它们 分 配 存储 空间 。 

在 C++ 中 ， 数 组 总 是 传 引 用 调用 的 。 因 此 ， 过 程 sum 中 的 变量 a 引用 主 程 序 中 的 list. 
图 2-26b Alc 中 从 栈 帧 中 标号 为 a 的 单元 指向 标号 为 list 的 单元 的 箭头 表示 a 引用 list. 





retAddr 





? |retVal 
retAddr 
n 
a 
list [3264] 3264 retVal 


a) 输入 1itst b) 调用 sum(1ist,3) c) 调用 sum(1ist,2) 
图 2-26 图 2-25 中 程序 的 运行 时 栈 


2.4.4 二 项 式 系 数 函 数 
递归 函数 的 下 一 个 例子 有 一 个 更 加 复杂 的 调用 序列 。 这 个 晒 数 计算 二 项 式 扩展 的 系数 。 
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考虑 如 下 的 扩展 ; 
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(x +y) =x+y 


b(n, k) = b(n-1)+ b(n-1,k-1) OSk <n 

Ee MBI, AA RM bn, k) JACE 
义 了 自己 。 也 可 以 看 到 ， 如 果 大 等 于 0 或 者 如 果 半 等 
Fk, 那么 二 项 式 系数 的 值 就 是 1， 数 学 表达 式 : 


(x + yy’ = x° + Ixy + 

(x +y =x +3xy+3xy + y 

(x + y)* = xt + 4x°y + 6x’y* +4xy + y4 
这 些 项 的 系数 叫 作 二 项 式 系数 (binomial coefficient)。 如 果 不 带 项 只 写 出 这 些 系数 ， 就 

形成 一 个 由 数值 组 成 的 三 角 ， 称 为 帕斯卡 三 角 (Pascal's triangle)。 图 2-27 是 一 个 最 高 到 7 

ORE FR BAY WAT KR = FA o 
从 图 2-27 可 以 看 到 ， 每 个 系数 是 它 正 上 方 和 左上 方 系数 的 和 。 例 如 ， 第 $ 行 第 2 列 的 

二 项 式 系数 10 等 于 4 加 6, 6 在 10 的 正 上 方 ,， 4 在 10 的 左上 方 。 
n KA k MMARKA b(n, k) 的 数学 表达 式 是 : 


b(n, 0)= 1 
b(k, k) = 1 
JE P36 VA PREY VE a o 


图 2-28 是 递归 计算 二 项 式 系数 值 的 程序 。 该 程 


序 直 接 建 立 在 b(n, kh 的 递归 定义 之 上 。 图 2-29 是 运 


行 时 栈 的 记录 。 图 2-29b、c 和 d 展示 了 前 3 个 栈 帧 的 
分 配 ， 分 别 代 表 调 用 bincoeff(3,1)、bincoeff(2,1) 和 bincoeff(1,1)。 第 一 个 栈 帧 的 


#include <iostream> 


using namespace std; 


int binCoeff (int n, 
the Mio VQ 


if ((k == 0) |] (n == k)) { 


return 1; 
} 
else { 


yl = binCoeff (n - 
y2 = binCoeff (n - 


return yl + y2; 
} 
} 


int main () { 


cout << “binCoeff (3, 


cout << endl; 
return 0; 


输出 
binCoeff(3, 


ij = 3 


图 2-28 


int k) { 


l; K)? 
1, k- 


1) p " 


// ra2 
F): 1 TAS 


<< binCoeff (3, 


二 项 式 系 数 的 递归 计算 


图 2-27 


Ls 





项 数 ，K 





wm 10 5 1 
ms 205 6 1 
2 33535 21 T 1 


二 项 式 系数 的 帕斯卡 三 角 


// ral 
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返回 地 址 是 主 程序 中 的 调用 程序 ， 接 下 来 两 个 栈 帧 的 返回 地 址 是 yl 赋值 语句 ， 即 标号 为 ra2 
的 那 条 语句 。 





Beje 


ra2 | retAddr 





= pa °, 
“站 t49) 名 ~ E tho a ~O ~D 





YU, / / / 
a) 开始 时 = -b) 调用 BC(3, D) c) 调用 BC(2, 1) —_d) 调用 BC(1, 1) 








/ 


h) 返回 i) 调用 BC(2, 0) 





f) 调用 BC(1, 0) g) 返回 
图 2-29 图 2-28 的 运行 时 栈 


图 2-29e 展示 了 从 bincoeff(1,1) 的 返回 ，y1 获得 晒 数 的 返回 值 1， 接 着 y2 赋值 语 
句 调 用 函数 bincoeff(1,0)。 图 2-29f 展 示 bincoeff(1,0) 执行 期 间 的 运行 时 栈 ， 每 个 
栈 帧 都 有 不 同 的 返回 地 址 。 

这 个 程序 的 调用 序列 不 同 于 前 面 那些 递归 程序 的 调用 序列 。 另 一 个 程序 是 不 断 分 配 栈 
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帧 ， 运 行 时 栈 到 达 最 大 高 度 ， 然 后 不 断 释 放 栈 帧 直到 运行 时 栈 为 空 。 这 个 程序 是 分 配 运行 时 
栈 ， 达 到 最 大 高 度 ， 但 是 不 会 连续 把 栈 里 的 栈 帧 都 释放 。 从 图 2-29d 到 图 2-29e 释放 栈 帧 ， 
但 是 从 图 2-29e 到 图 2-29f 分 配 栈 帧 ; 从 图 2-29f 到 图 2-29g 到 图 2-29h 又 释放 栈 帧 ， 而 从 
图 2-29h 到 图 2-291 又 分 配 栈 帧 。 为 什么 会 这 样 呢 ? 这 是 因为 这 个 晒 数 有 两 个 递归 调用 而 不 
是 一 个 。 如 果 基 础 判断 为 真 ， 那 么 曙 数 不 执行 递归 调用 ; 但 如 果 基 础 判断 为 假 ， 则 顶 数 执行 
两 个 递归 调用 ， 一 个 计算 y1， 一 个 计算 y2。 图 2-30 展示 了 该 程序 的 调用 序列 。 可 以 看 到 
它 是 树 状 的 。 树 的 每 个 结 点 代表 一 个 男 数 调用 。 除 主 程 序 外 ， 每 个 结 点 有 两 个 孩子 结 点 或 者 
没有 ， 分 别 对 应 于 有 两 个 递归 调用 或 者 没有 递归 调用 。 
参照 图 2-30， 调 用 和 返回 序列 是 


Main program 





Call BC(3, 1) 
Call BC(2, 1) 
Call BC(1, 1) 
Return to BC(2, 1) 
Call BC(1, 0) 1 


Return to BC(2, 1) 
Return to BC(3, 1) 
Call BC(2, 0) 


Return to BC(3, 1) 


BC(1,1 BC(1,0 
Return to main program 


可 以 把 调用 树 的 执行 顺序 形象 化 ， 把 调用 树 想象 成 海 ”图 2-30 图 2-28 所 不 程 订 的 调用 本 
洋 的 海 岩 线 。 一 盘 船 从 主 程序 的 左边 沿 着 海岸 线 开 始 航 
行 ， 并 一 直 保持 海岸 在 它 的 左边 。 船 会 按照 结 点 被 调用 
和 返回 相同 的 顺序 访问 结 点 ， 图 2-31 给 出 了 访问 路 径 。 

当 从 微观 的 角度 分 析 递归 程序 时 ， 在 构建 运行 时 栈 
的 记录 之 前 ， 构 建 调用 树 更 容易 一 些 。 一 旦 构建 了 调用 
树 ， 就 很 容易 看 清楚 运行 时 栈 的 行为 。 每 当 船 在 树 中 辣 
下 访问 结 点 时 ， 程 序 分配 栈 帧 ; 每 当 船 在 树 中 向 上 访问 
结 点 时 ， 程 序 释放 栈 帧 。 

可 以 根据 调用 树 确定 运行 时 栈 的 最 大 高 度 。 只 需 记 
录 到 达 调 用 树 最 低 结 点 时 分 配 的 栈 帧 数量 ， 这 个 数 对 应 
的 就 是 运行 时 栈 的 最 大 高 度 。 图 2-31 图 2-28 所 示 程 序 的 执行 顺序 

按照 执行 顺序 来 画 调用 树 不 是 最 简单 的 方法 。 前 面 
那个 程序 的 执行 序列 从 下 面 开 始 

Main program 

Call BC(3. 1) 
Call BC(2. 1) 
Call BC(1, 1) 


不 应 该 用 这 样 的 顺序 来 画 调用 树 。 从 下 面 这 样 开 始 比较 容易 一 些 
Main program 
Call BC(3, 1) 





Return to BC(3, 1) 


Return to BC(3, 1) 

Return to main program 

从 程序 代码 可 以 看 到 ，BC(3, 1) 会 调用 它 自 己 两 次 : BC(2, 1) 一 次 ，BC(2, 0) 一 次 。 然 
后 回 到 BC(2, 1) 确定 它 的 孩子 ， 换 句 话说 ， 就 是 要 先 确 定 本 结 点 的 所 有 孩子 ， 然 后 再 分 析 每 
个 孩子 的 更 深层 次 的 调用 。 

相对 于 “深度 优先 ”的 构造 方法 ， 这 是 用 “广度 优先 ”的 方法 来 构造 树 。 在 复杂 的 调用 
树 中 多 次 返回 到 较 高 层 结 点 时 ， 深 度 优先 的 问题 就 来 了 。 你 可 能 不 记得 该 结 点 的 执行 状态 是 
什么 ， 也 就 不 能 确定 它 的 下 一 个 孩子 结 点 是 什么 。 如 果 一 次 性 确定 了 一 个 结 点 的 所 有 和 孩子 ， 
那么 就 不 需要 记得 所 有 结 点 的 执行 状态 。 


2.4.5 ”逆转 数组 元 素 顺序 


图 2-32 是 一 个 递归 过 程 而 不 是 函数 ， 它 把 一 个 字符 数组 的 元 素 顺序 反 转 过 来 。 

这 个 过 程 把 数组 str 中 str[j] A strik] 之 间 的 字符 顺序 逆转 。 主 程序 是 想 逆转 B 
Ald 之 间 的 字符 ， 因 此 它 调 用 reverse， 人 参数 j 为 0，k 为 7。 

这 个 过 程 通过 把 问题 分 解 成 更 小 的 问题 来 解决 。 因 为 0 小 于 7， 该 过 程 知 道 要 把 0 和 ?7 
之 间 的 字符 闭 转 ， 所 以 它 把 strio] 和 str[7] 互 换 ， 接 着 递归 调用 自己 来 交换 str[1] 和 
str[6] 之 间 的 字符 。 如 果 j 大 于 或 等 于 k， 就 不 需要 交换 ， 过 程 也 就 什么 都 不 用 做 。 图 2-33 
展示 了 开始 时 运行 时 栈 的 记录 。 


#incTude <iostream> 
using namespace std; 





char word[32] = "Backward"; 


word | Backward] word 


void reverse (char str[], int j, int k) { IN 
char temp; a) char word [32] = 'Backward' b) 调用 reverse(word,0,7) 
Tf 7 < KY 
temp = str[j]; 
str[j] = strik]; 
str[k] = temp; 
reverse(str, j +1, k - 1); 
} // ra2 
) 


int main () { 
reverse (word, 0, 7); 
cout << word << endl; // ral 
return 0; 


出 


drawkcaB 





c) 交换 ‘d’ A ‘B’ d) 调用 reverse(word,1,6) 
图 2-32 ”逆转 数组 元 素 的 递归 过 程 图 2-33 图 2-32 所 示 程 序 的 运行 时 栈 


2.4.6 MIS 


DE SES iF RK EP EF VS TG Ho TE RAS BT LA De, RR 3 个 柱子 
和 一 组 直径 不 同 的 盘子 组 成 。 柱 子 编号 为 1、2 和 3， 每 个 盘子 的 中 央 有 一 个 洞 ， 能 套 在 柱 
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子 上 。 游 戏 的 初始 设置 是 所 有 的 盘子 都 套 在 一 根 柱 子 上 ， 没 有 盘子 直接 放 在 直径 比 它 小 的 盘 
子 上 。 图 2-34 是 4 个 盘子 的 初始 设置 。 
要 解决 的 问题 是 把 所 有 盘子 从 起 始 的 柱子 移 到 另 一 根 柱子 ， 
并 遵循 下 列 规则 : 
e 每 次 只 可 以 移动 一 个 盘子 ， 只 能 把 一 根 柱 子 顶 部 的 盘子 移 
动 到 另 一 根 柱子 顶部 。 
e 不 能 把 大 直径 的 盘子 放 在 小 直径 盘子 的 上 面 。 
解决 这 个 问题 的 过 程 有 3 个 参数 n、j 和 k， 其 中 
e n 是 要 移动 的 盘子 数量 。 
68 e j 是 起 始 柱子 。 
69 e k 是 目标 柱子 。 
j 和 k 是 整数 ， 用 于 标识 柱子 。 给 定 j 和 k 的 值 ， 中 间 柱 子 的 编号 可 以 用 6-j-k 计算 表示 ， 
所 谓 中 间 柱 子 就 是 既 不 是 起 始 柱子 也 不 是 目标 柱子 的 柱子 。 例 如 ， 如 果 起 始 柱 子 是 1 而 目标 
柱子 是 3， 那 么 中 间 柱 子 是 6-1-3 = 2。 





Bjarne Stroustrup 

Bjarne Stroustrup 1950 年 出 生 于 丹麦 。 虽 然 并 非 出 身 于 学 术 家 庭 ， 但 他 依靠 自身 
的 努力 从 丹麦 阿 鲁 斯 大 学 (Aarhus University) 获得 

数学 专业 硕士 学 位 ， 然 后 又 从 剑桥 大 学 ( Cambridge 
University) 获得 计算 机 专业 博士 学 位 。 

Stroustrup 小 时 候 并 没有 接触 过 计算 机 ， 在 大 学 数 
学 系 里 他 才 第 一 次 见 到 计算 机 。 那 台 计 算 机 占据 了 一 
整个 房间 ， 他 学 会 了 用 Algo 60 语言 在 上 面 编程 。 他 博 
士 期 间 的 工作 是 用 Simula67 语言 写 了 一 个 分 布 式 系 统 
模拟 器 。 依 靠 写 一 些 其 他 专职 人 员 才 能 写 出 来 的 小 型 
商业 程序 的 收入 ， 他 供 自己 完成 了 正规 的 教育 。 他 认 
为 这 段 经 历 帮 助 他 理解 了 编程 在 现实 世界 的 重要 性 。 

1979 年 完成 了 剑桥 的 学 业 后 ， poe donc 成 为 了 AT&T 贝尔 实验 
室 在 Murry Hill 的 研究 科学 家 。C 语言 和 UNIX 操作 系统 就 是 在 这 个 实验 室 被 研发 出 来 并 
且 流 行 开 来 的 。 

Moia 并 不 满足 于 当时 的 编程 语言 ， 他 发 明了 一 种 新 的 带 类 的 C(C with Classes) 

， 在 C 语 言 中 加 入 了 面向 对 象 的 编程 特性 ， 就 像 Simula67 中 的 一 样 。 最 终 ， 这 个 语言 
eat C++, Stroustrup 作为 C++ 的 发 明 者 为 人 们 所 熟知 。Stroustrup 很 早 就 决定 希望 他 
的 语言 能 够 支持 真实 的 用 户 。 他 了 解 如 果 人 们 不 需要 去 学 习 一 门 全 新 的 语言 ， 他 的 语言 就 

能 被 广泛 接受 和 使 用 ， 所 以 他 使 得 除了 有 少数 例外 ，C++ 与 C 语言 兼容 。 也 就 是 说 ， 大 多 
数 用 C 语言 书写 的 程序 能 够 用 C++ 编译 器 进行 翻译 (显然 反 过 来 不 行 )。 这 个 目标 对 语言 设 
计 errr 但 是 在 它 的 使 用 上 是 大 有 神 益 的 。Stroustrup ¥ Zit: “ 即使 没有 C 语言 可 
以 与 之 兼容 ， 我 也 会 选择 其 他 某 种 语言 来 兼容 的 。 我 曾经 ， 现 在 依然 ， 相 信 如 果 我 的 时 间 
用 来 花 在 创造 另 一 种 书写 循环 的 方式 上 ， 那 就 太 不 值得 了 。” 事 实 上 ，C++ 语言 在 市 场 上 非 
常 成 功 。 微 软 的 Word, Adobe 的 Photoshop 和 Google 的 搜索 引擎 都 是 以 C++ 来 编写 的 。 














Stroustrup 当选 了 美国 国家 工程 院 院 士 ，AT&T 贝尔 实验 室 院 士 ， 荣 获 ACM 的 Grace 
Murray Hopper 奖 。 在 本 书 编写 之 时 ， 他 是 德州 农工 大 学 (Texas A&M University) 计算 机 
科学 首席 教授 (College of Engineering Chair in Computer Science), 

“RERA AREMA ei AE A RE, A BAT RAT. RR oi AUR ELET,” 


—— Bjarne Stroustrup 


要 把 n 个 盘子 从 柱子 j 移 到 柱子 k, ACRE n=1, WRÆ, ASA fh I hat 
子 从 柱子 j 移 到 柱子 k 即 可 。 但 如 果 不 是， 就 把 问题 分 解 为 几 个 小 部 分 : 

e 把 n-1l 个 盘子 从 柱子 j 移 到 中 间 柱 子 。 

e 把 一 个 盘子 从 柱子 j 移 到 柱子 k。 

© 把 n-1l 个 盘 于 从 中 间 柱 子 移 到 柱子 ko 

图 2-35 展示 了 从 柱子 1 移动 4 个 盘子 到 柱子 3 的 问题 的 分 解 。 











Lec dåd hhe 


a) 将 3 个 盘子 从 柱子 1 移 到 柱子 2 b) 将 1 个 盘子 从 柱子 1 移 到 柱子 3 c) 将 3 个 盘子 从 柱子 2 移 到 柱子 3 


图 2-35 ”假设 你 能 把 3 个 盘子 从 一 个 柱子 移动 到 另 一 个 时 ， 把 4 个 盘子 从 柱子 1 
移 到 柱子 3 的 解决 方案 


假定 初始 n 个 盘子 堆放 的 顺序 是 正确 的 ,这样 的 操作 过 程 保 证 盘子 不 会 放 在 比 它 直径 小 
的 盘子 上 。 例 如 ， 如 图 2-35 所 示 ， 要 把 4 个 盘子 从 柱子 1 移 到 柱子 3， 这 个 过 程 告诉 你 应 
该 把 最 上 面 的 3 个 盘子 从 柱子 1 移 到 柱子 2， 把 底部 的 一 个 从 柱子 1 移 到 柱子 3， 接着 再 把 
那 3 个 从 柱子 2 移 到 柱子 3。 

把 最 上 面 的 3 个 盘子 从 柱子 1 移 到 柱子 2， 柱 子 1 上 就 只 剩 下 底部 的 一 个 盘子 。 这 个 盘 
子 是 直径 最 大 的 ， 因 此 在 移动 其 他 盘子 的 过 程 中 ， 放 在 它 上 面 的 任何 盘子 都 是 更 小 的 。 为 了 
把 底部 这 个 盘子 从 柱子 1 移 到 柱子 3， 柱子 3 必须 是 空 的 。 这 样 就 不 会 把 这 个 底部 的 盘子 放 
在 一 个 较 小 的 盘子 上 。 当 把 那 3 个 盘子 从 柱子 2 移 到 柱子 3 上 时 ， 会 把 它们 放 在 当前 在 柱子 
3 底部 的 这 个 最 大 的 盘子 上 ， 这 样 3 个 盘子 就 被 正确 地 放 在 柱子 3 上 了 。 

这 个 过 程 是 递归 的 。 第 一 步 要 把 3 个 盘子 从 柱子 1 移 到 柱子 2。 为 此 ， 要 把 2 个 盘子 从 
柱子 1 移 到 柱子 3， 再 把 另 一 个 从 柱子 1 移 到 柱子 2， 接 着 把 那 2 个 从 柱子 3 移 到 柱子 2。 
图 2-36 展示 了 这 个 移动 的 序列 。 根 据 前 述 推理 ， 能 够 正确 地 实施 这 些 步 又。 在 把 2 个 盘子 
从 柱子 1 移 到 柱子 3 的 过 程 中 ， 可 以 把 这 两 个 盘子 中 的 任意 一 个 放 在 柱子 1 底部 的 两 个 盘子 
E, 不 用 担心 违反 规则 。 


os 


a) 将 2 个 盘子 从 柱子 1 移 到 柱子 3 b) 将 1 个 盘子 从 柱子 1 移 到 柱子 2 ec) 将 2 个 盘子 从 柱子 3 移 到 柱子 2 


图 2-36 假设 你 能 把 两 个 盘子 从 一 个 柱子 移动 到 为 一 个 柱子 时 ,把 3 个 盘子 从 柱子 1 
移 到 柱子 2 的 解决 方案 
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最 终 ， 可 以 把 这 个 问题 归 约 到 只 需 移动 一 个 盘子 的 基础 步骤 ， 而 一 个 盘子 的 解决 方案 是 
容易 的 。 本 章 结尾 的 一 道 问题 就 是 对 汉 诺 塔 游戏 的 解决 方案 进行 编程 。 


2.4.7 相互 递归 


在 有 些 问题 最 适合 的 解决 方案 中 ， 过 程 不 直接 调用 它们 自己 ,但 是 仍然 是 递归 的 。 假 设 
一 个 主 程序 调用 过 程 a， 过 程 a 包含 一 个 对 过 程 b 的 调用 。 如 果 过 程 b 又 包含 一 个 对 过 程 a 
的 调用 ， 那 么 a 和 b 是 相互 递归 的 。 尽 管 过 程 a 不 直接 调用 它 自 己 ， 但 是 通过 过 程 b， 它 间 
接地 调用 了 它 目 己 。 

和 普通 递归 相 比 ， 相 互 递 归 的 实现 没有 什么 不 同 。 运 行 时 栈 上 分 配 栈 帧 的 方式 也 是 一 样 
的 ， 先 分 配 参 数 ， 接 着 是 返回 地 址 ， 再 是 局 部 变量 。 

不 过 ， 在 C++ 程序 中 ， 声 明 相互 递归 过 程 时 有 一 个 小 问题 。 原 因 在 于 C++ 语言 要 求 程 序 
的 声明 必须 先 于 它 的 使 用 。 如 果 过 程 a 调用 过 程 b， 那 么 在 代码 中 ，b 的 声明 必须 在 a 的 声明 
之 前 ; 但 是 如 果 过 程 b 调用 过 程 a， 那么 在 代码 中 ，a 的 声明 必须 在 b 的 声明 之 前 。 问 题 是 ， 
如 果 每 个 过 程 都 调用 另 一 个 ， 代 码 中 每 个 程序 都 必须 出 现在 另 一 个 之 前 ， 这 显然 是 不 可 能 的 。 

针对 这 种 情况 ，C++ 提供 了 函数 原型 (function prototype)， 它 允许 程序 员 写 出 第 一 个 程序 的 
头 ， 而 没有 过 程 体 。 哨 数 原型 包括 完整 的 形 参 列表 ,但 在 程序 体 的 位 置 ， 放 一 个 分 号 〈; )。 
在 一 个 过 程 的 因数 原型 之 后 ， 就 可 以 是 第 二 个 过 程 的 声明 ， 然 后 是 第 一 个 过 程 的 过 程 体 。 

例 2.6 这 是 刚才 讨论 的 相互 递归 的 过 程 a 和 b 的 架构 : 

常量 、 类 型 、 主 程序 变量 

void a (someType x) ; 

void b (someOtherType y) { 

bi it 4E tk 
em a (someType x) { 
a 的 过 程 体 

main( ) { 

主 程序 的 执行 语句 

} 

如 果 b 对 a 有 一 个 调用 ,编译 右 将 会 核实 实 参 的 数量 和 类 型 是 否 与 前 面 在 也 数 原型 里 扫 
HH a 的 形 参 匹配 。 如 果 a 对 b 有 一 个 调用 ， 那么 这 个 调用 会 在 a 的 程序 体 中 ， 因 为 b 在 a 
的 代码 块 之 前 ， 因 此 编译 器 已 经 扫描 了 b 的 声明 。 o 

尽管 相互 递归 不 如 递归 常见， 但 有 一 些 编 译 器 是 基于 一 种 叫 递 归 下 降 (recursive 
descent) 的 技术 ， 这 个 技术 很 大 程度 上 使 用 了 相互 递归 。 看 看 C++ 语句 的 结构 ， 你 就 能 明 
白 为 什么 是 这 样 。 把 一 个 if mEHE—Tt wilet, MXA while LmBEH—T if 中 ， 
这 是 很 有 可 能 的 。 在 使 用 递归 下 降 技 术 的 编译 器 里 有 一 个 过 程 用 于 翻译 if 语句 ， 男 一 个 过 
程 用 于 翻译 while 语句 。 当 正在 翻译 外 层 if 语句 的 过 程 遇 到 while 语句 时 ， 它 将 调用 翻 
译 while 语句 的 程序 。 而 当 翻 译 while 语句 的 过 程 遇 到 髓 套 在 里 面 的 if 语句 时 ， 它 又 调 
用 翻译 if 语句 的 过 程 ， 因 此 是 相互 递归 的 。 


2.4.8 递归 的 成 本 
本 节 例 子 的 选取 只 基于 一 个 标准 : 例子 说 明 递 归 的 能 力 。 可 以 看 到 在 使 用 递归 的 解决 方 
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案 中 ， 运 行 时 栈 需 要 大 量 的 存储 空间 ， 同 时 也 要 花费 时 间 分 配 和 释放 栈 帧 。 递 归 人 解决 方案 在 
空间 和 时 间 上 都 是 昂贵 的 。 

如 果 一 个 问题 有 不 用 递归 的 简单 解法 ， 那 么 非 递归 方法 通常 优 于 递归 方法 。 图 2-18 中 
的 计算 阶乘 的 非 递归 函数 肯定 比 图 2-22 的 递归 阶乘 男 数 好 。 图 2-25 对 数组 元 素 求 和 与 图 2-32 
都 可 以 不 用 递归 ， 只 用 循环 就 可 以 很 容易 地 编程 。 

二 项 式 系 数 b(n, k) 有 一 个 基于 阶乘 的 非 递归 定义 : 


b(n, K) =n ky 


如 果 非 递归 地 计算 阶乘 ， 基 于 这 个 定义 的 程序 可 能 比 相应 的 递归 程序 效率 高 很 多 。 两 
种 方法 的 选择 还 有 一 个 可 以 考虑 的 因素 : 非 递 归 方 法 需要 乘法 和 除法 ， 而 递归 方法 仅 需 要 
加 法 。 

有 些 问题 本 质 上 就 是 递归 的 ， 仅 用 非 递 归 方 法 解决 非常 困难 。 汉 诸 塔 游戏 问题 的 解决 
本 质 上 就 是 递归 的 。 你 可 以 试 着 不 用 递归 去 解决 它 ， 看 看 到 底 会 有 多 难 。 快 速 排序 法 ， 最 
知名 的 排序 算法 之 一 ， 也 属于 这 种 类 型 ， 用 非 递归 方法 对 快速 排序 进行 编程 比 用 递归 方法 
难得 多 。 


2.5 ”动态 内 存 分 配 


在 C++ 中 ， 值 存储 在 主 存储 器 的 3 个 不 同 区 域 : 

e 全 局 变量 存储 在 内 存 的 固定 位 置 。 

o 局 部 变量 存储 在 运行 时 栈 。 

© 动态 分 配 的 变量 存储 在 堆 中 。 

过 程 调用 和 返回 时 ， 不 能 控制 堆 的 分 配 和 释放 ， 而 是 借助 于 指针 变量 来 分 配 堆 。 堆 的 分 
配 不 是 通过 过 程 调用 在 运行 时 栈 上 自动 触发 ， 它 称 为 动态 内 存 分 配 。 


2.5.1 指针 


当 声 明 一 个 全 局 或 者 局 部 变量 时 ， 指 定 它 的 类 型 。 例 如 ， 可 以 把 类 型 指定 为 整数 或 字 
符 或 数组 。 类 似 地 ， 当 声明 一 个 指针 时 ， 必 须 声 明 它 所 指向 的 类 型 。 指 针 本 和 喘 可 以 是 全 局 变 
量 ， 也 可 以 是 局 部 变量 ， 但 是 它 指 回 的 值 位 于 堆 中 ， 既 不 是 全 局 变量 也 不 是 局 部 变量 。 

C++ 提供 了 两 个 运算 符 来 控制 动态 内 存 分 配 : 

e new， 在 堆 中 分 配 一 块 空间 。 

e delete， 释 放 堆 中 的 一 块 空 间 。 

虽然 用 delete 运算 符 释 放 内 存 非常 重要 ,但 本 书 并 不 阐述 它 是 怎样 进行 的 。 本 书 中 
使 用 指针 的 程序 都 是 软件 设计 的 坏 例子 ， 因 为 省 略 了 释放 的 过 程 。 这 些 程序 的 目的 是 展示 
HOL6 层 和 Asmb5 层 之 间 的 关系 ， 到 第 6 章 这 个 关系 就 会 变 得 更 明显 ， 因 为 第 6 章 会 讲述 
程序 的 翻译 。 

new 运算 符 要 求 它 的 右边 是 类 型 ， 该 运算 执行 时 做 两 件 事 情 : 

e 在 堆 中 分 配 一 个 足够 大 的 存储 单元 用 于 存放 它 右边 类 型 的 值 。 

e 返回 一 个 指针 ， 指 向 新 分 配 的 存储 空间 。 

与 指针 有 关 的 赋值 有 两 种 : 给 指针 赋 一 个 值 ， 或 者 给 指针 指 癌 的 单元 赋 一 个 值 。 第 一 种 
赋值 叫 指针 赋值 ， 它 按照 下 列 规则 执行 : 
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o 如 果 p 和 q 是 指针 ， 赋 值 p = q 使 得 p 指向 q 指向 的 同一 单元 。 

图 2-37 是 一 个 无 实际 意义 的 程序 ， 只 是 为 了 说 明 
new 运算 符 的 行为 以 及 指针 赋值 的 规则 。 它 使 用 全 局 指 
针 ， 如 果 是 局 部 指针 ， 输 出 也 是 一 样 的 。 如 果 是 局 部 指 
针 ， 和 那么 它们 会 分 配 在 运行 时 栈 上 而 不 是 内 存 的 固定 位 
置 中 。 


#include <iostream> 
using namespace std; 


int *a, *b, *c; 


int main () { 


在 全 局 指针 的 声明 中 

用 二 
变量 名 前 的 星 号 表示 这 个 变量 是 一 个 指向 整数 的 指针 ， 
而 不 是 整数 。 图 2-38a 将 一 个 指针 的 值 图 形 化 地 表示 为 
SM) o 


a = new int; 
ka = 5; 

b = new int; 

*j = 3; 

c= a; 

a= b; 

xa = 2 + FCs 
cout << “*a = * 


<< *a << endl: 


图 2-38b 说 明了 new 运算 符 的 行为 。 它 在 堆 上 分 
配 了 一 个 足够 大 的 单元 来 存储 整数 值 ， 并 把 这 个 值 返回 
给 指针 。 这 个 赋值 使 得 a 指向 新 分 配 的 单元 。 图 2-38c 
展示 了 怎样 访问 指针 指向 的 单元 。 因 为 a 是 指针 ， 所 
VW xa 是 a 指针 指向 的 单元 。 图 2-38f 说 明了 指针 赋值 
规则 。 赋 值 c=a {Ë c 指向 a 指向 的 同一 单元 ; 类 似 地 ， 
WE a=b 使 a 指向 b 指向 的 那个 单元 。 在 图 2-38h F, 
该 赋值 不 是 对 指针 a 进行 赋值 ， 而 是 对 指针 a 指向 的 单 


cout << "*b = n 
cout << "*c =" 
return 0; 


<< *b << endl; 
<4 *c << endl; 





图 2-37 一 个 无 实际 意义 的 C++ 程序 ， 


元 进行 赋值 。 只 是 为 了 说 明 指 针 的 类 型 
‘ a b| ， | bj e m 
a) 初始 状态 b) a = new int; c) *a = 5; d) b = new int; 
al 一 ad poe aj ER 
ES b| 4 D| hs | A 


f)c=a 


图 2-38 图 2-37 所 示 程 序 的 历史 记录 


h) *a = 2 + *C; 


2.5.2 ”结构 


结构 是 C++ 中 数据 抽象 的 关键 。 它 们 允许 程序 员 把 基本 类 型 的 变量 整合 到 一 个 单一 的 
抽象 数据 类 型 中 。 数 组 和 结构 都 是 一 组 值 ， 不 过 数组 的 所 有 单元 要 求 类 型 必须 是 一 样 的 ， 
通过 整 型 数值 作为 索引 访问 每 个 单元 ; 而 在 结构 中 ， 各 个 单元 可 以 是 不 同类 型 的 。C++ 提 
供 struct 结构 把 多 个 值 集合 成 一 个 组 。C++ 程序 员 给 每 个 称 为 字段 的 单元 一 个 字段 名 。 

图 2-39 所 示 的 程序 声明 了 一 个 名 为 person 的 struct， 它 有 4 个 字段 ， 分 别 叫 
YE first. last, age 和 gender。 该 程序 声明 了 一 个 叫 bi11 的 全 局 变量 ， 其 类 型 为 
person， 字 7 段 first、.1ast 和 gender 是 char 类型， 字段 age 是 int KH. 
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#include <iostream> 
using namespace std; 


struct person { 
char first; 
char last; 
int age; 
char gender; 

F 

person bill; 


int main () { 
cin >> bill.first >> bill.last >> bill.age >> bill.gender; 
cout << “Inttiatss: T << D111 iret <4 DITI: Test << endis 
cout << "Age: " << bill.age << endl; 
cout << "Gender: " 
if (bill.gender == 'm') { 
cout << “male\n"; 
} 
else { 
cout << "female\n"; 
} 
return 0; 


} 

输入 

bj 32 m 

输出 
Initials: bj 


Age: 32 
Gender: male 





图 2-39 C++ 的 结构 


为 了 访问 结构 的 字段 ， 在 变量 和 要 访问 的 字段 之 间 放 一 个 句号 ， 例 如 ，if 语句 的 测试 条 件 
if (bill.gender == ‘m') 


将 访问 变量 bill 的 名 为 gender WFE. 
2.5.3 ” 链 式 数据 结构 


程序 员 经 党 把 指针 和 结构 结合 起 来 实现 链 式 数据 结构 。struct 通常 称 为 结 点 ， 指 针 指 
问 结 点 ， 结 点 中 又 有 指针 字段 。 在 数据 结构 中 ， 结 点 的 指针 字段 作为 指 问 为 一 个 结 点 的 链 
接 。 图 2-40 是 一 个 实现 链表 (linked list) 数据 结构 的 程序 ， 第 一 个 循环 输入 一 个 整数 序列 ， 
以 特殊 的 标记 符号 值 -9999 结束 ， 输 入 流 中 的 第 一 个 值 放 在 链表 的 末端 ; 第 二 个 循环 输出 链 
表 中 的 每 个 元 素 。 图 2-41 是 图 2-40 所 示 程 序 最 开始 几 条 语句 执行 的 历史 记录 。 

指针 值 为 0 是 一 个 特殊 的 值 ， 它 保证 指针 不 指 回 任何 单元 。 在 C++ 程序 中 ， 它 通常 用 
作 一 个 链 式 结构 的 标记 符号 值 。 语 句 

first = 0; 
把 这 个 特殊 的 值 赋 给 局 部 指针 First. Al 2-41b 把 这 个 值 图 形 化 地 表示 为 一 个 虚线 三 角 。 

用 星 号 来 访问 指针 指向 的 单元 ， 用 句号 来 访问 结构 的 字段 。 如 果 一 个 指针 指向 一 个 


75 
77 


52 BRD BSRRZZ(F6Z) 


struct， 那 么 要 访问 struct ， 必 须 同 时 使 用 星 号 和 句号 。 
例 2.7 下 列 语句 将 变量 value KIER #include <iostream> 
变量 first 指 回 的 结构 的 data 字段 using namespace std; 
(*first).data = value; [ 
struct node { 
因为 这 种 星 号 和 句号 的 组 合 太 和 常用 了 ， 所 int data; 
以 C++ 提供 了 箭头 运算 符 ->， 其 格式 是 一 个 连 | ，" next 
接 符 紧 接 一 个 大 于 符号 。 例 2.7 中 的 语句 可 以 用 


这 个 运算 符 缩 写 为 int main () { 
node *Tirst, "p; 
first->data = value; int value; 


如 图 2-41f、k 所 示 。 该 程序 用 同样 的 缩写 访问 pita = 2 


cin >> value; 


next 字段 ， 如 图 2-41g、1 Pra. while (value != -9999) { 
p = first; 

总 结 first = new node; 

7 first->data = value; 

在 C++ 中 ， 值 存储 在 主 存 储 髓 的 3 个 不 同 ipae -pi 
TU cin value; 

区 域 中 : 全 局 变量 存放 在 内 存 中 的 固定 位 置 ， } 
局 部 变量 存放 在 运行 时 栈 和 堆 。 改 变 控制 流 一 for (p = first; p != 0; p = p->next) { 
般 顺 序 的 方法 有 两 种 : 选择 和 循环 。C++ 的 if |) SON SS Ponta Se 
和 switch 语句 实现 选择 ，while、do 和 for return 0; 


语句 实现 循环 。 所 有 5 种 语句 都 用 关系 运算 符 
测试 条 件 的 真 伪 。 WA 

运行 时 栈 的 LIFO Fe HERA FEIM RRA FE a SU “Rae 
Val. PRAY oP Bc EE: 压 人 返回 值 的 存储 
空间 ， 压 人 实 参 、 压 人 返回 地 址 、 压 人 局 部 变 
量 的 存储 空间 。 过 程 的 分 配 过 程 除了 不 压 人 返 
回 值 的 存储 空间 之 外 都 是 一 样 的 。 栈 帧 是 由 一 
次 果 数 或 过 程 调用 中 压 人 运行 时 栈 的 所 有 项 组 成 的 。 

递归 过 程 是 一 种 调用 它 自己 的 过 程 。 为 了 避免 无 休止 地 调用 它 自己 ,递归 程序 必须 有 一 
个 if 语句， 作为 停止 递归 调用 的 安全 出 口 。 微 观 和 宏观 是 两 种 不 同 的 思考 递归 的 角度 。 微 观 


value value = value } 10 | 
p EZ JEZ 
first first = i first = I 
7 / 7 
a) main() 中 的 初始 状态 b) first = 0; c) cin >> value; 


value | 10 value EJ 
value 
=. i. 
p 
first 一 ji first = oOo Fe 
7 7 


d)p = first; e) first = new node; f) first->data = value; 


A 2-41 图 2-40 所 示 程 序 的 前 几 条 语句 执行 的 历史 记录 





图 2-40 一 个 输入 和 输出 链表 的 C++ 程序 
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value value 

"ger > 
first | > iT first | l 10 |p 
7 7 = 





i)p = first; 





多 
l) first->next = p; m) cin >> value; 


图 2-41 ( 续 ) 


角度 考虑 程序 执行 期 间 运 行 时 栈 的 细节 ， 而 宏观 角度 基于 更 高 的 抽象 层次 ， 与 数学 归纳 法 证 明 
相关 。 微 观 用 于 分 析 ， 宏 观 用 于 设计 。 

用 new 运算 符 在 堆 上 分 配 存 储 空间 称 为 动态 内 存 分 配 。new 运算 符 在 堆 上 分 配 一 个 内 存 
单元 ， 并 返回 一 个 指向 该 单元 的 指针 。 结 构 是 一 组 值 ， 它 不 要 求 所 有 的 值 都 是 同一 类 型 。 每 
个 值 存储 在 一 个 字段 中 ， 每 个 字段 有 一 个 名 字 。 链 接 数据 结构 由 结 点 组 成 ， 这 些 结 扣 都 是 结 
构 ， 结 构 中 有 指针 指向 其 他 的 结 点 。 链 表 中 的 结 点 有 一 个 值 字段 ， 还 有 一 个 通常 名 为 next 的 
字段 ， 它 指向 链表 中 的 下 一 个 结 扩 。 


练习 


2.4 节 

. 主 程序 第 一 次 调用 图 2-25 中 的 函数 sum， 从 第 二 次 开始 它 就 自己 调用 自己 。* (a) 该 函数 总 共 被 调 
用 了 多 少 次 ? (b) 画 出 函数 第 三 次 被 调用 后 ， 主 程序 变量 和 运行 时 栈 的 情况 。 应 该 有 3 个 栈 帧 。(c) m 
出 从 (b) 调用 返回 前 ， 主 程序 变量 和 运行 时 栈 的 情况 。 应 该 有 3 个 栈 帧 ， 不 过 内 容 和 (b) 的 不 同 。 


一 一 


2. 给 出 图 2-28 中 函数 binCoeff 的 调用 树 ， 调 用 树 的 画 法 如 图 2-30 所 示 ， 主 程序 中 的 调用 语句 如 下 : 
*(a) binCoeff(4,1) (b) binCoeff(5,1) 
(c) binCoeff(3,2) (d) binCoeff(4,4) 


(e) binCoeff(4,2) 
该 函数 被 调用 了 多 少 次 ?” 程序 执行 期 间 ， 运 行 时 栈 上 栈 帧 的 最 大 数量 是 多 少 ? 程序 是 按照 什么 顺序 
进行 调用 和 返回 的 ? 


3. 对 练习 2 中 的 情况 ， 画 出 从 下 列 函 数 调用 返回 前 的 运行 时 栈 ， 运 行 时 栈 的 画 法 如 图 2-29 所 示 。 
*(a) binCoeff(2,1) (b) binCoeff(3,1) 
(c) binCoeff(1,0) (d) binCoeff(4,4) 


(e) binCoeff(2,1) 
Æ (e) F, binCoeff (2,1) SIFY, MMM Mx RROTA EAI zs FT RR o 
.给 出 图 2-32 中 逆转 字符 串 数 组 字母 顺序 的 程序 的 调用 树 ， 调 用 树 的 画 法 如 图 2-30 Ba. RKI% 


> 
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reverse 被 调用 了 多 少 次 ? 在 运行 时 栈 上 分 配 的 栈 帧 最 大 数量 是 多 少 ?” M Hd H eR g 
reverse 后 的 运行 时 栈 。 
. 斐 波 那 契 数列 是 
011293953 is 2.x. 
每 个 斐 波 那 契 数列 中 的 数 是 数列 中 它 前 面 两 个 数 之 和 。 数 列 最 开始 有 两 个 数 ， 递 归 地 定义 为 
fib(0) = 0 
fib(1) = 1 
fib(n) = fib(n ~ 1) + fib(n -2) n>1 
画 出 下 列 辈 波 那 契 数 的 调用 树 : 
(a) fib(3) (b) fib(4) (c) fib(5) 
对 上 述 每 个 调用 ，fib 被 调用 了 多 少 次 ? 在 运行 时 栈 上 被 分 配 的 栈 帧 最 大 数量 是 多 少 ? 


.对 于 问题 2.15 中 汉 诺 塔 问题 的 解决 方案 ， 画 出 4 个 盘子 情况 的 调用 树 。 程 序 被 调用 了 多 少 次 ? 运行 


时 栈 上 栈 帧 的 最 大 数量 是 多 少 ? 


.神秘 数字 递归 地 定义 为 


myst(0) = 2 

myst(1) = 1 

myst(n) = 2*myst(n -1)+myst(n-2) n> 1 

(a) 画 出 myst(4) 的 调用 序列 。(b) myst(4) 的 值 是 什么 ? 


.检查 下 面 的 C++ 程序 。(a) 画 出 过 程 最 后 一 次 被 调用 后 的 运行 时 栈 。(b) 程序 的 输出 是 什么 ? 


#Hinclude <iostream> 
using namespace std; 


void what (char word [], int j) { 
ifj > 1) { 
word [j] = word [3 - j]; 
what (word, j - 1); 
} #7? ra? 
} 


int main () { 
char str [5] = "abcd"; 
what (str, 3); 
// ral 
cout << str << endl; 
return 0; 

} 


jo) ee 
2.1 7 
. 写 一 个 C++ 程序 ， 输 入 两 个 整数 ， 输 出 它们 的 商 和 余数 。 


输入 样本 

13 4 

输出 样本 

13/4 has value 3 
13%4 has value 1 





22% 
10. 写 一 个 C++ 程序 ， 输 入 一 个 整数 ， 输 出 这 个 整数 是 否 是 偶数 。 


输入 样本 
15 
输出 样本 


15 is not even 


11. 写 一 个 C++ 程序 ， 输 入 两 个 整数 ， 输 出 这 两 个 整数 之 间 的 整数 之 和 。 


输入 样本 


9 12 


输出 样本 





The sum of the numbers between 9 and 12 inclusive is 42. 


2.37 


12. 写 一 个 C++ 函数 


int rectArea (int len, int wid) 


返回 长 len 宽 wid 的 矩形 的 面积 。 用 一 个 输入 矩形 的 长 和 宽 ， 输 出 矩形 面积 的 主 程序 测试 它 。 在 


主 程序 中 而 不 是 了 清 数 中 输出 该 值 。 
输入 样本 
6 10 
输出 样本 


The area of a 6 by 10 rectangle is 60. 


13. 写 一 个 C++ 函数 


void rect (int& ar, int& per, int len, int wid) 


计算 长 1en % wid 的 和 矩形 的 面积 ar 和 周 长 per。 用 一 个 输入 和 矩形 的 长 和 宽 ， 输 出 矩形 面积 和 周 长 
的 主 程序 来 测试 它 。 在 主 程序 中 而 不 是 晒 数 中 输出 值 。 


输入 样本 
6 10 
输出 样本 
Length : 
Width: 10 
60 


Area: 


Perimeter: 32 


2.4% 


14. 写 一 个 C++ 程序 ， 请 用 户 输入 一 个 小 的 整数 ， 然 后 用 递归 函数 返回 练习 5 中 定义 的 斐 波 那 契 值 。 
不 要 使 用 循环 。 在 主 程序 而 不 是 在 函数 中 输出 值 。 


6 


输入 /输出 样本 


Which Fibonacci number? 8 


The number is 21 


15. 写 一 个 C++ 程序 打印 汉 诺 塔 问题 的 解决 方案 。 要 求 用 户 输入 游戏 中 盘子 的 数量 ， 所 有 盘子 初始 是 
在 哪 根 柱子 上 ， 要 被 移动 到 哪个 柱子 上 。 


输入 /输出 样本 


How many disk do you want 


From which peg? 3 


To which peg? 2 


Move 
Move 
Move 
Move 
Move 
Move 


Move 


a 
a 
a 
a 
a 
a 
a 


disk 
disk 
disk 
disk 
disk 
disk 
disk 


from 
from 
from 
from 
from 
from 


from 


peg 
peg 
peg 
peg 
peg 
peg 
peg 


ww ND UOU W 


to 
to 
to 
to 
to 
to 
to 


to move? 3 


peg 
peg 
peg 
peg 
peg 
peg 
peg 
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写 一 个 名 为 rotateLeft， 返 回 值 为 void 的 递归 函数 ， 它 循环 左 移 一 个 数组 的 前 n FBR. AS 
循环 左 移 n 个 元 素 ， 要 递归 地 循环 左 移 前 n-1 个 元 素 ， 然 后 交换 最 后 两 个 元 素 。 例 如 ， 循 环 左 移 5 
TGR : 
50 60 70 80 90 
先 递 归 地 循环 左 移 前 4 个 元 素 : 
60 70 80 50 90 
然后 交换 后 两 个 元 素 : 
60 70 80 90 50 
写 一 个 主 程序 来 测试 它 ， 输 入 一 个 整数 的 个 数 ， 然 后 是 要 循环 移动 的 整数 数值 。 输 出 是 原 整 数值 和 
循环 移动 后 的 值 。rotateLeft 中 不 要 使 用 循环 ， 在 主 程序 而 不 是 细 数 中 输出 值 。 
输入 样本 
5 50 60 70 80 90 
输出 样本 


Original list: 50 60 70 80 90 
Rotated list: 60 70 80 90 50 


.号 一 个 函数 


int maximum (int list[], int n) 

递归 地 找 出 1ist[0] 和 1istr[n] 之 间 最 大 的 整数 。 假 设 数列 中 至 少 有 一 个 元 素 。 用 主 程 序 测试 
它 ， 输 入 是 整数 数量 ， 接 着 是 整数 数值 。 输 出 是 原 整 数值 ， 接 着 是 最 大 整数 值 。maximum 中 不 要 
使 用 循环 。 在 主 程序 而 不 是 函数 中 输出 值 。 


输入 样本 


5 50 30 90 20 80 
输出 样本 


Original list: 50 30 90 20 80 
Largest value: 90 


25% 


18. 


图 2-40 的 程序 生成 了 一 个 元 素 顺 序 与 输入 时 相反 的 链表 。 修 改 程序 的 第 一 个 循环 ， 使 生成 的 链表 
和 输入 顺序 一 致 。 不 要 改动 第 二 个 循环 。 

输入 样本 

10 20 30 40 -9999 


输出 样本 
10 20 30 40 


. 二 义 搜索 树 的 结 点 声明 如 下 : 


struct node { 
node* leftCh; 
int data; 
node* rightCh; 

}; 

leftCh 是 指向 左 子 树 的 指针 ，rightCch 是 指 疝 右 子 树 的 指针 。 写 一 个 C++ 程序， 输入 一 个 整数 

序列 ，-9999 为 标记 符号 ， 把 它们 插入 二 叉 搜索 树 。 写 一 个 递归 过 程序 遍历 搜索 树 , 以 升序 输出 这 

些 数 值 。 

输入 样本 

40 90 50 10 80 30 70 60 20 -9999 

输出 样本 

10 20 30 40 50 60 70 80 90 
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信息 的 表示 





印刷 字 是 人 类 最 重要 的 发 明之 一 。 我 们 看 到 的 本 书页 面 上 的 单词 代表 存储 在 纸 上 的 信 
息 ， 当 阅读 时 ， 这 些 信息 就 传递 给 我 们 。 就 像 印刷 的 页 面 一 样 ， 计 算 机 有 存储 器 用 于 存储 信 
息 。 中 央 处 理 单元 (CPU) 能 够 从 存储 器 获取 信息 ， 就 像 从 页 面 上 的 单词 获取 信息 一 样 。 

一 些 计算 机 术语 就 是 来 自 这 样 的 类 比 。CPU 从 内 存 读 取 (read) 信息 ， 把 信息 写 入 (write) 
内 存 ， 这 些 信息 被 分 为 字 ( word)。 在 一 些 计算 机 系统 中 ,一 大 组 字 ， 通 常 从 几 百 到 几 千 不 
等 ， 又 组 成 页 (page)。 

位 于 HOL6 层 的 C++， 信 息 以 存储 在 内 存 中 的 变量 或 者 磁盘 中 的 文件 中 值 的 形式 存在 。 
本 章 将 展示 在 ISA3 层 上 信息 是 如 何 存储 的 。 机 器 层 的 信息 表示 与 高 级 语言 级 的 表示 大 为 不 
同 。 在 ISA3 层 上 ， 信 息 表示 不 太 以 人 为 本 。 我 们 在 后 面 的 章节 讨论 中 间 层 Asmb5 层 和 OS4 
层 上 的 信息 表示 ， 以 及 它们 与 HOL6 EA ISA3 层 的 关系 。 


3.1 无 符号 二 进 制 表示 


早期 的 计算 机 是 机 电 式 的 ， 即 所 有 计算 是 通过 称 为 继电器 (relay) 的 移动 开关 来 实现 
的 。 哈 佛 大 学 的 Howard H. Aiken (#24678 - XH) 于 1944 年 建造 的 Mark I 计算 机 就 是 这 种 
类 型 的 机 器 。 这 个 项 目 上 ,Aiken 获得 了 国际 商用 机 器 公司 (BM) 总 裁 Thomas J. Watson ( 托 
Oir. KER) 的 资金 支持 。 当 时 ，Mark I 计 算 机 中 的 继 电 句 比 加 法 计算 需 中 的 机 械 齿 轮 计 算 
速度 快 得 多 。 

甚至 在 Mark I 完 成 之 前 ， 艾 奥 瓦 州立 大 学 的 John V. Atanasoff (“8 + 阿 塔 纳 索 夫 ) 已 
经 构造 完成 了 一 台 用 于 解 线性 方程 的 电子 计算 机 。1941 年 ,John W. Mauchly (“48 - FTA) 
访问 Atanasoff 的 实验 室 ，1946 年 与 宾夕法尼亚 大 学 的 本 Presper Eckert (E HHA - Ro 
特 ) 合作 建造 了 著名 的 电子 数值 积分 计算 机 (ENIAC)。 相 比 于 Mark I 继 电器 的 每 秒 10 次 ， 
ENIAC 的 19 000 个 真空 管 每 秒 可 以 执行 5000 次 加 法 。 与 ENIAC 一 样 ， 现 代 计 算 机 也 是 电 
子 的 ， 不 过 执行 计算 的 是 集成 电路 ( IC) 而 不 是 真空 管 。 每 个 IC 中 有 数 千 个 与 收音 机 中 一 
样 的 晶体 管 。 


3.1.1 ”二进制 存储 器 


电子 计算 机 的 存储 器 不 能 直接 存储 数字 和 字母 ， 它 们 只 能 存储 电子 信号 。 当 CPU 从 内 
存 读 取 信息 时 ， 它 检测 到 一 个 信号 ， 其 电压 等 于 两 节 手电 简 电 池 产 生 的 电压 。 

计算 机 内 存 有 一 个 最 显著 的 性 质 : 每 个 存储 位 置 包 含 一 个 高 电 平 信号 或 者 低 电 平 信号 ， 
绝 不 会 是 两 者 之 间 的 其 他 信号 。 存 储 位 置 就 像 是 怀孕 一 样 ， 要么 怀 了 要 么 没 怀 ， 没有 折 中 的 
可 能 。 

数字 (digital) 这 个 词 意 味 着 存储 在 内 存 中 的 信号 只 能 有 固定 数量 的 数值 。 二 进 制 意味 者 
仅 有 两 个 可 能 的 值 。 实 际 上 ， 现 在 市 场 上 所 有 计算 机 都 是 二 进 制 的 ， 因 此 每 个 存储 位 置 包含 一 
个 高 电 平 或 者 一 个 低 电 平 ， 每 个 位 置 的 状态 也 被 描述 为 开 或 关 ， 或 者 描述 为 包含 1 或 0。 


ZB3¢ BEHET 


ws 


每 个 存储 单元 称 为 二 进 制 数字 (binary digit) 或 位 (bit， 也 译作 比特 )。1 位 只 能 是 1 或 
0， 绝 不 可 能 是 其 他 诸如 2、3、A 或 Z 之 类 ,这 是 基本 概念 。 计 算 机 存储 器 中 存储 的 每 条 信 
息 ， 不 管 是 你 的 信用 卡 透支 总 额 还 是 你 的 街道 地 址 ， 都 是 以 二 进 制 1 和 0 的 形式 存储 的 。 
实际 上 ， 计 算 机 存储 器 中 的 位 被 组 合 在 一 起 形成 单元 
(cell)。 例 如 ， 一 台 7 位 的 计算 机 会 以 如 图 3-1 所 示 的 每 7 位 — 1 
组 成 一 组 的 方式 存储 它 的 信息 。 你 可 以 把 单元 想 作 一 组 方 框 ， wai 
每 个 方 框 包含 一 个 1 或 0， 除 此 之 外 什么 都 没有 。 Bic fofrfrfofrfofa 
前 两 行 是 不 可 能 的 ， 因 为 有 些 方 框 中 的 值 不 是 0 或 1， 最 后 一 [To [of 
行 也 是 不 可 能 的 ， 因 为 每 个 方 框 必须 包含 一 个 值 。 存 储 位 不 能 BOOOODo 
为 空 。 ojolololololo 


不 同 计算 机 的 每 个 单元 中 的 位 数 不 同 ， 然 而 现在 大 多 数 计 b) 一 个 7 位 单元 的 可 能 什 
算 机 的 每 个 单元 为 8 位 。 本 章 给 出 几 个 单元 大 小 不 同 的 例子 来 [ss ol 
说 明 普 适 原 理 。 EE 

诸如 数字 和 字母 这 样 的 信息 必须 以 二 进 制 的 形式 表示 才能 llslolalnly 


存储 到 存储 器 中 。 用 于 存储 信息 的 表示 方式 叫 作 编码 (code). 

本 节 给 出 存储 无 符号 整数 的 编码 ， 本 章 其 他 小 节 描述 了 存储 DD 
其 他 类 型 数据 的 编码 ， 下 一 章 将 分 析 存 储 器 中 存储 程序 命令 的 
编码 。 


3.1.2 ”整数 


数字 必须 以 二 进 制 形 式 表示 才能 存储 到 计算 机 存储 器 中 。 具 体 的 编码 视 这 个 数字 有 小 数 
部 分 还 是 整数 而 定 。 如 果 是 整数 ， 那 么 编码 也 取决 于 它 永 远 是 正 的 还 是 也 可 以 为 负 。 

无 符号 二 进 制 (unsigned binary) 用 于 表示 永远 为 正 的 整数 。 在 学 习 二 进 制 之 前 ， 我 们 
先 复习 十 进 制 (decimal 或 缩写 dec)， 然 后 按 这 个 方法 学 习 二 进 制 。 

也 许 因 为 我 们 用 10 根 手 指 计数 和 加 法 而 发 明了 十 进 制 ,使 用 这 个 优雅 规制 写 的 算术 书 
出 现在 公元 8 世纪 的 印度 ， 它 被 翻译 成 阿拉 伯 文 并 最 终 被 商人 带 到 了 欧洲 ， 这 里 它 被 从 阿拉 
伯 文 翻译 成 拉丁 文 。 因 为 那 时 人 们 认为 它 起 源 于 阿拉 伯 ， 所 以 数字 被 称 为 阿拉 伯 数 字 ， 但 是 
印度 - 阿拉 伯 数 字 应 该 是 更 准确 的 名 字 ， 因 为 它 实 际 上 起 源 于 印度 。 

以 10 为 底 的 阿拉 人 数字 计数 如 下 《当然 是 回 下 读 ): 


c) 一 个 7 位 单元 的 不 可 能 值 
图 3-1 主 存 中 7 位 的 内 存单 元 


Nm” bh WN © 
J 
= 
—" 
~ 
N 
A 
2 
— 
U3 
Co 


从 0 开始 ， 印 度 人 接着 发 明了 下 一 个 数字 1 的 符号 ， 然 后 是 2， 直 到 符号 9。 这 时 ， 他 
们 看 着 自己 的 手 想 到 了 一 个 神奇 的 点 子 。 在 最 后 一 根 手指 后 面 ， 他 们 没有 发 明 新 的 符号 ， 而 
是 用 前 面 两 个 符号 1 和 0 一 起 表示 下 一 个 数字 10。 

剩 下 的 故事 你 都 知道 了 。 当 到 19 时 ， 他 们 看 到 9 是 他 们 创造 的 符号 中 最 高 的 符号 了 ， 
因此 他 们 把 它 降 到 0 同时 把 1 增加 到 2， 这 样 形成 20。 从 29 到 30， 最 终 99 到 100， 不 断 地 
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继续 ， 都 是 同样 的 处 理 。 

如 果 我 们 仅 有 8 个 指头 而 不 是 10 个 将 会 怎样 呢 ? 到 了 7， 下 一 个 数字 用 完了 最 后 一 根 
手指 ， 我 们 不 必 发 明 一 个 新 符号 ， 下 一 个 数字 会 以 10 来 表示 。 以 8 AE (八进制 ，octal 或 
缩写 为 oct) 计数 是 这 样 的 : 


DC 
jh 
N 
N 
U 
(>, 
Ww 
N 
BS 
ON 


八进制 中 77 的 下 一 个 数字 是 100. 

比较 十 进 制 和 八进制 方法 ， 你 会 注意 到 八进制 的 5 (oct) 和 十 进 制 的 5 (dec) 是 同样 的 
数字 ， 但 八进制 21 (oct) 和 十 进 制 21 (dec) 是 不 一 样 ， 反 而 和 十 进 制 17 (dec) 是 一 样 的 。 
数字 以 八进制 表示 看 上 去 比 它们 实际 上 以 十 进 制 表 示 要 显得 大 一 些 。 

假如 我 们 不 是 有 10 个 或 者 8 个 指头 而 是 有 3 个 指头 会 怎样 呢 ? 规律 是 一 样 的 ， 三 进 制 
计数 是 这 样 的 : 


12 110 201 222 1020 


最 后 ， 我 们 看 看 无 符号 二 进 制 表 示 。 计 算 机 仅 有 两 根 手指 ， 以 2 为 底 (二进制 binary, 
或 简称 bin) 计数 遵循 与 八进制 和 三 进 制 完全 相同 的 方法 : 


0 111 1110 10101 11100 100011 

l 1000 1111 10110 11101 100100 

10 1001 10000 10111 11110 100101 

11 1010 10001 11000 11111 100110 

100 1011 10010 11001 100000 i 
101 1100 10011 11010 100001 


3.1.3 ”基本 转换 


10110 
给 定 一 个 二 进 制 数 ， 有 几 种 方法 来 | ton 0 1 的 位 置 =0 
确定 它 对 应 的 十 进 制 数 。 一 种 方法 是 简单 abies 1 2 的 位 置 = 2 
地 以 二 进 制 和 十 进 制 往 上 数 到 那个 数 ， 这 ee a 
种 方法 对 小 的 数字 非常 有 效 。 男 一 种 方法 8 的 位 置 1 eran 16 
是 把 二 进 制 数 每 个 为 1 的 位 的 位 置 值 都 加 16 的 位 置 22(dec) 
起 来 。 a) 10110 (bin) 的 位 置 值 b) 将 10110 (bin) 转换 成 十 进 制 数 


例 3.1 图 3-2a 展 示 了 10110 (bin) 图 3-2 将 二 进 制 数 转换 为 十 进 制 数 


的 位 置 值 ， 最 右边 是 1 的 位 置 值 ( 称 为 最 低 有 效 位 )， 每 个 位 置 值 都 两 倍 于 它 前 面 的 那个 位 
置 值 。 图 3-2b 展示 了 得 到 22 (dec) 的 加 法 。 口 
例 3.2 无 符号 二 进 制 类 似 于 我 们 熟悉 的 十 进 制 。 

图 3-3 展示 了 58 036 (dec) 的 位 置 值 。 数 字 58 036 代 

表 6 个 1, 3410, A 100, 8 个 1000 和 5 个 10 000。 a Lae 
从 最 右边 1 的 位 置 开 始 ， 每 个 位 置 值 都 10 倍 于 它 前 面 Leese 
的 位 置 值 。 在 二 进 制 中 ， 每 个 位 置 值 是 两 倍 于 它 前 面 的 TODO Rui 
那个 位 置 值 。 = 10 000 的 位 置 

无 符号 数值 能 方便 地 表示 为 数 制 基底 的 多 项 式 ( 基 图 3-3 58036 (dec) 的 位 置 值 
底 也 称 为 数 制 的 基数 (radix))。 图 3-4 给 出 了 10110 (bin) 

和 58 036 (dec) 的 多 项 式 表示 。 最 低 有 效 位 总 是 基数 et 
的 0 KA , 即 lo 接 下 来 的 有 效 位 是 基数 的 一 次 方 ， Bp a) 二 进 制 数 10110 

基数 本 身 。 从 多 项 式 的 结构 可 以 看 到 每 个 位 置 值 是 前 一 | sx 108+ 8 109+ 0X 102+ 3X 10'+ 6X 10° 
个 位 置 值 乘 以 基数 。 b) 十 进 制 数 58 036 

在 二 进 制 中 ， 只 有 1 的 位 置 的 值 是 奇数 ， 所 有 其 他 图 3.4 无 符号 数 的 多 项 式 表 示 

位 置 (2 的 位 置 , 4 的 位 置 , 8 的 位 置 等 ) 的 值 都 是 偶数 。 
如 果 1 的 位 置 的 值 是 0， 那 么 二 进 制 数 的 值 将 是 几 个 偶数 值 相 加 的 和 ， 因 此 一 定 是 偶数 。 另 
一 方面 ， 如 果 二 进 制 数 的 1 的 位 置 的 值 是 1， 那么 它 的 值 就 是 把 1 和 几 个 偶数 值 相 加 ， 因 此 
一 定 是 奇数 。 与 在 十 进 制 中 一 样 ， 你 可 以 通过 检测 1 的 位 置 的 数字 很 容易 地 确定 一 个 二 进 制 
数 是 奇数 还 是 偶数 。 

确定 十 进 制 数 等 值 的 二 进 制 数 有 点 儿 环 手 。 一 种 方法 是 连续 地 把 这 个 数 除 以 2， 保留 余 
数 的 记录 ， 余 数 的 逆序 就 是 这 个 二 进 制 数 。 

例 3.3 3-5 把 22〈dec) 转换 成 二 进 制 。22 除 以 2 
等 于 11， 余 数 为 0， 把 余数 写 在 右 列 ， 接 着 11 除 以 2 等 0 
于 5 余 1。 继 续 进 行 直 到 商 为 0， 这 样 形成 一 个 余数 列 ， 1 
从 下 往 上 读 取 余数 就 形成 二 进 制 数 10110。 口 

注意 : 最 低 有 效 位 是 用 原始 数字 除 以 2 得 到 的 余数 ， 1 
这 与 仅 通过 检测 最 低 有 效 位 确定 一 个 二 进 制 数 是 奇数 还 是 E: 
偶数 是 一 致 的 。 如 果 原 始 数 是 偶数 ， 除 以 2 将 得 到 余数 


0， 这 个 0 将 是 最 低 有 效 位 。 相 反 ， 如 果 原 始 数 是 奇数 ， 被 除数 
最 低 有 效 位 将 是 1。 图 3-5 将 十 进 制 数 转化 为 二 进 制 数 





余数 


3.1.4 无 符号 整数 的 范围 


所 有 这 些 基于 阿拉 伯 数 字 的 计数 方法 都 可 以 表示 任意 大 的 数字 。 然 而 ， 一 个 真实 的 计 
算 机 中 每 个 单元 的 位 数 是 有 限 的 。 图 3-6 展示 了 一 个 7 位 的 单元 是 如 何 存储 数 22 (dec) AY. 
注意 开头 的 两 个 0， 它 们 不 影响 数值 ， 但 是 对 于 指定 存储 器 位 置 的 内 容 是 必需 的 。 对 于 7 位 
的 计算 机 来 说 ， 不 带 方 框 ， 这 个 数 应 该 写作 


001 0110 
开头 的 两 个 0 仍然 是 必须 要 有 的 。 本 书 在 显示 位 串 时 ， 从 右 ofofifofi[ijo 
开始 每 4 位 一 组 ， 组 间 有 一 个 空格 〈 为 了 易 读 )。 图 3-6 7 位 单元 中 的 数 22 (dec) 
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无 符号 数值 的 范围 取决 于 一 个 单元 的 位 数 。 一 个 全 0 的 序列 代表 最 小 的 无 符号 值 ， 全 1 
的 序列 代表 最 大 的 。 

例 3.4 一 个 7 位 的 单元 可 以 存储 的 最 小 无 符号 整数 是 

000 0000 (bin) 
可 以 存储 的 最 大 无 符号 整数 是 

111 1111 (bin) 
最 小 的 是 0 (dec), HAM EE 127 (dec)。 一 个 7 位 单元 不 能 存储 大 于 127 的 无 符号 整数 。 口 


3.1.5 无 符号 加 法 


无 符号 二 进 制 数 加 法 和 无 符号 十 进 制 加 法 一 样 ， 只 不 过 更 容易 ， 因 为 只 需 学 习 2 位 加 法 
法 则 而 不 是 10 个 数字 的 加 法 法 则 。 位 加 法 法 则 是 


0 十 0 三 0 
0 二 1 三 1 
1 十 0 三 1 
1+1=10 


我 们 熟悉 的 十 进 制 中 的 进位 技术 也 一 样 在 二 进 制 中 适用 。 如 果 一 列 中 的 两 个 数 相 加 大 于 
1， 那 么 必须 进 1 到 下 一 列 。 

例 3.5 假设 有 一 个 6 位 的 单元 ， 把 01 1010 和 01 0001 两 个 数 相 加 ， 简 单 地 从 最 低 有 
效 位 列 开始 把 一 个 数 写 在 男 一 个 上 面 : 


01 1010 
ADD 01 0001 


10 1011 


注意 当 到 达 从 右 数 的 第 5 列 时 ，1 十 1 等 于 10， 必 须 写 0 并 进 1 到 下 一 列 ， 在 最 后 一 
列 1 十 0 十 0 得 出 和 中 最 左边 的 1. 

为 了 验证 这 个 进位 技术 对 二 进 制 有 效 ， 把 这 两 个 数 与 它们 的 和 都 转换 为 十 进 制 数 : 

01 1010 (bin) = 26 (dec) 

01 0001 (bin) = 17 (dec) 

01 1011 (bin) = 43 (dec) 


毫 无 疑问 ， 在 十 进 制 中 ，26 + 17 = 43. 口 
例 3.6 ”这些 例子 显示 了 进位 可 以 沿 着 连续 的 列传 递 : 
00 0011 00 1111 
ADD 01 0001 ADD 001001 
01 0100 01 1000 
在 第 二 个 例子 中 ， 当 到 达 从 右 数 的 第 四 列 时 ， 有 一 个 来 自前 一 列 的 进位 ,那么 1+1+1 
等 于 11 ， 必 须 写 1 并 进 1 到 下 一 列 。 口 
3.1.6 ”进位 位 


前 面 例子 中 的 6 位 单元 的 表 数 范围 是 00 0000 到 111111 (bin), 或 0 到 63 (dec), WA 
加 数 在 表 数 范围 内 ， 而 和 不 在 是 有 可 能 的 ， 这 时 和 就 太 大 了 而 不 能 装 进 6 位 的 存储 单元 。 
为 了 标记 出 这 种 情况 ，CPU 有 一 个 特殊 的 位 称 为 进位 位 (carry bit)， 以 字母 C 表示 。 当 
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两 个 二 进 制 数 相 加 时 ,如果 最 左 列 (最 高 有 效 位 ) 的 和 产生 了 一 个 进位 ,那么 C 被 设置 为 1， 
否则 C 为 0。 换 名 话说 ,，C 总 是 包含 单元 最 左 列 产生 的 进位 。 在 前 面 所 有 的 例子 中 ， 和 都 在 
表 数 范围 内 ， 所 以 进位 位 为 0。 

例 3.7 这 里 有 两 个 展示 进位 位 影响 的 例子 : 


01 0110 10 1010 
ADD 10 0010 ADD 01 1010 
C=0 11 1000 C=1 000100 


在 第 二 个 例子 中 ，CPU 进行 42 + 26 的 运算 ， 正 确 的 结果 是 68， 但 它 太 大 不 能 装 进 6 位 
的 单元 中 。 注 意 6 位 单元 的 表 数 范围 是 0 到 63， 因 此 只 能 存储 最 右 的 6 位 ， 得 到 不 正确 的 
结果 4， 而 进位 位 也 被 设置 为 1， 表 示 最 左 一 列 有 进位 。 口 

计算 机 对 两 个 二 进 制 数 的 减法 是 通过 加 上 第 二 个 数 的 负数 来 实现 的 。 例 如 ， 要 计算 减法 
42-26， 计 算 机 会 计算 加 法 42+(-26 )。 因 为 没有 办 法 存储 负数 ， 所 以 不 可 能 用 无 符号 表示 
两 个 整数 的 减法 运算 。 下 一 节 将 描述 存储 负数 的 表示 法 。 用 这 种 表示 法 ，C 位 是 加 上 第 二 个 
数 的 负数 的 进位 。 


3.2 ” 补 码 二 进 制 表示 


无 符号 二 进 制 表示 法 仅 适 用 于 非 负 整数 。 如 果 计 算 机 要 处 理 负 整数 ， 那 么 它 必 须要 用 一 
种 不 同 的 表示 法 。 

假设 有 一 个 6 位 的 单元 要 存储 -5 (dec). ALA 5 (dec) 是 101 (bin)， 所 以 你 可 能 想到 
图 3-7 所 示 的 样子 。 但 这 是 不 可 能 的 ， 因 为 所 有 的 位 必须 是 
0 或 1。 谨 记 计 算 机 是 二 进 制 的 。 上 面 这 种 存储 值 要 求 每 个 a 
方 框 可 以 存储 0 或 1 或 破 折 号 ， 这 样 的 计算 机 必须 是 三 进 制 图 3-7 尝试 在 二 进 制 中 存储 负数 
而 不 是 二 进 制 。 

解决 这 个 问题 的 办 法 是 保留 单元 的 第 一 个 方 框 来 表示 符号 。 这 样 ，6 位 单元 将 分 为 两 个 
部 分 一 一 1 位 符号 位 和 5 位 数值 位 ， 如 图 3-8 所 示 。 因 为 符号 位 必 TTT 
须 是 0 或 1， 所 以 一 种 可 能 是 让 符号 位 0 表示 正 数 ， 符 号 位 1 表示 


HRM. AA +5 可 以 表示 为 : 
00 0101 be 
-5 pei 图 3-8 有 符号 整数 的 结构 


在 这 种 表示 法 中 ，+5 和 -5 的 数值 位 是 相同 的 ， 仅 仅 是 符号 位 不 同 。 
然而 ， 很 少 有 计算 机 用 前 面 这 种 代码 ， 因 为 如 果 进 行 十 进 制 的 +$ 加 -$， 得 到 0， 但 如 
果 进 行 二 进 制 的 00 0101 加 10 0101 (符号 位 和 所 有 )， 得 到 


00 0101 
ADD 100101 


C=0 10 1010 


这 显然 不 等 于 0。 如 果 CPU 硬件 可 以 用 无 符号 二 进 制 加 法 的 普通 算法 对 包含 符号 位 的 完整 
数字 +5 和 -5 进行 相 加 并 得 到 0， 这 会 更 加 方便 。 

补 码 (two’s complement) 二 进 制 表示 有 这 个 特性 ， 正 数 由 符号 位 0 和 与 无 符号 二 进 制 
表示 一 样 的 数值 位 组 成 。 例 如 ， 十 进 制 +5 (dec) 仍然 表示 为 00 0101. 
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但 是 -5 (dec) 的 表示 不 是 100101, mÆ 111011, AX +5 加 -5 是 


00 0101 
ADD 11 1011 


C=1 00 0000 


注意 6 位 的 和 都 是 0， 和 我 们 期 望 的 一 样 。 

按照 6 位 单元 的 二 进 制 加 法 法 则 ，11 1011 称 为 00 0101 的 加 法 逆 元 (additive reverse). 
求 加 法 逆 元 的 运算 称 为 求 补 (negation), 445-4 NEG。 对 一 个 数 求 补 也 称 为 取 它 的 补 码 。 

现在 我 们 所 需 的 是 求 一 个 数 补 码 的 法 则 。 有 个 简单 的 法 则 是 基于 反 码 (ones’complement)， 
反 码 是 把 所 有 的 1 变 为 0，0 变 为 1 的 二 进 制 序列 。 反 码 也 称 为 NOT 运算 。 

例 3.8 假设 一 个 6 位 单元 ，00 0101 的 反 码 是 

NOT 00 0101 = 11 1010 LJ 

找 出 补 码 规则 的 线索 是 把 一 个 数 和 它 的 二 进 制 反 码 相 加 的 结果 。 因 为 1 加 0 等 于 1,0 
加 1 等 于 1， 所 以 任意 数 和 它 的 反 码 相 加 将 生成 一 个 全 1 的 序列 ， 然 而 把 一 个 单独 的 1 和 全 
1 的 数 相 加 就 会 得 到 一 个 全 0 的 数 。 

例 3.9 00 0101 加 上 它 的 反 码 


00 0101 
ADD 11 1011 


C=1 111111 


得 到 是 全 1， 再 把 这 个 数 加 1 得 到 


11 1111 
ADD 00 0001 


C=1 00 0000 


这 个 数 是 全 0 的 。 口 

换 句 话说 ， 把 一 个 数 加 上 它 的 反 码 ， 再 加 1 就 得 到 全 0 的 数 ， 因 此 一 个 数 的 反 码 加 1 一 
定 是 它 的 补 码 。 

例 3.10 将 000101 的 反 码 加 1 得 到 它 的 补 码 。 

NOT 000101 = 11 1010 


11 1010 
ADD 00 0001 


11 1011 
00 0101 的 补 码 是 111011, BD, 
NEG 00 0101 = 11 1011 
11 1011 的 确 是 00 0101 的 负数 ， 因 为 如 前 所 示 两 者 相 加 为 0。 口 
不 管 一 个 数 有 多 少 位 ， 对 一 个 数 求 补 的 一 般 法 则 是 : 
e 一 个 数 的 补 码 等 于 它 的 反 码 加 1。 
或 者 用 NEG 和 NOT 运算 表示 为 
e NEGx = 1+NOTx 
在 我 们 熟悉 的 十 进 制 中 ; 如 果 对 一 个 负数 值 取 负 ， 那 么 将 得 到 一 个 正 值 ， 代 数 表达 式 为 
-(-x) =x 


这 里 x 为 正 值 。 如 果 求 补 码 的 法 则 是 有 效 的 ， 那 么 一 个 负数 值 的 补 码 应 该 是 相应 的 正 值 。 


例 3.11 如 果 对 -5 (dec) 取 补 码 会 怎样 ? 
NOT 11 1011 = 00 0100 


00 0100 
ADD 00 0001 


00 0101 
HE! 如 你 所 期 望 的 ， 又 得 到 了 +5 (dec). 


3.2.1 补 码 的 表 数 范围 
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假定 有 一 个 4 位 单元 以 补 码 形式 存储 整数 ， 那 么 这 个 单元 能 表示 的 整数 范围 是 多 少 ? 

数值 最 大 的 正 整数 是 0111 (bin)， 即 +7 (dec)。 这 和 在 无 符号 二 进 制 数 中 最 大 值 为 1111 
不 同 ， 因 为 第 一 位 被 保留 作为 符号 位 且 一 定 是 0。 在 无 符号 二 进 制 中 ， 用 4 位 单元 可 以 存储 
的 最 大 数 是 +15 (dec), MA 4 位 都 用 于 存储 数值 。 在 补 码 表示 中 ， 能 存储 的 最 大 数 只 是 


+7 (dec), KAILA 3 位 用 于 数值 。 


数值 最 大 的 负 整 数 是 什么 呢 ” 这 个 问题 的 答案 可 能 不 太 显 而 吻 


7 的 每 个 正 整 数 的 补 码 ， 在 图 中 看 到 了 什么 规律 没有 ? 
我 们 注意 到 补 码 运算 自动 在 负 整 数 的 符号 位 生成 了 一 
， 它 本 来 就 应 该 这 样 。 偶 数 仍 然 以 0 结尾 ， 奇 数 仍 然 以 
1 结尾 。 

而 且 ， 如 你 所 期 望 的 ， 二 进 制 -6 加 1 得 到 -5$， 类 似 

， 二 进 制 -7 加 1 得 到 -6。 我 们 可 以 从 4 位 挤 出 一 个 更 
E -8。 二 进 制 -8 加 1 得 到 -7， 因 此 -8 应 该 用 
1000 表示 。 图 3-10 是 一 个 4 位 存储 单元 的 完整 有 符号 整 
数 表 。 

-8 (dec) 有 一 个 其 他 负 整 数 没有 的 属性 ， 如 果 取 -7 的 


人 


补 码 会 得 到 +7， 如 下 所 示 : 
NOT 1001 = 0110 
0110 

ADD 0001 


0111 
但 如 果 取 -8 的 补 码 ， 得 到 的 还 是 -8: 
NOT 1000=0111 


0111 
ADD 0001 


1000 
因为 4 位 无 法 表示 +8. 


我 们 已 经 确定 了 4 位 单元 的 补 码 二 进 制 表 数 范围 以 二 进 


制 表 达 是 1000 到 0111 ， 或 者 以 十 进 制 表达 是 -8 到 +7。 


不 管 单元 包含 多 少 位 ， 模 式 都 是 一 样 的 。 最 大 的 正 整数 
而 数值 最 大 的 负 整 数 是 一 个 1 后 面 全 


是 一 个 0 后 面 全 是 1, 


是 0， 它 的 数值 比 最 大 正 整 数 大 1。-1 (dec) 用 全 1 表示 。 


见 。 图 3-9 展示 了 最 大 到 


| 





图 3-9 4 位 计算 机 中 取 补 码 的 结果 
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图 3-10 4 位 单元 的 有 符号 整数 
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例 3.12 6 位 补 码 表示 的 表 数 范围 ， 用 二 进 制 表示 是 
10 0000 到 01 1111 


或 者 十 进 制 表示 是 

-32 到 31 
和 其 他 的 负 整 数 不 同 ，10 0000 的 补 码 就 是 它 自己 10 0000。 还 可 以 看 到 -1 (dec) = 11 1111 
(bin ) 。 O 
3.2.2 基数 转换 


把 一 个 负数 从 十 进 制 转换 为 二 进 制 分 为 两 步 。 首 先 ， 把 它 的 数值 部 分 当 作 无 符号 表示 转 
换 为 二 进 制 ; 其 次 ， 按 照 补 码 的 方式 对 它 取 反 。 

例 3.13 ”对 于 10 位 单元 的 -7 (dec) 

+7 (dec) = 00 0000 0111 (bin) 

NOT 000000 0111 = 11 1111 1000 


11 1111 1000 
ADD 00 0000 0001 


11 1111 1001 


因此 -7 (dec) 的 补 码 是 11 1111 1001 (bin). 口 

在 采用 补 码 表示 的 计算 机 中 ， 把 一 个 数 从 二 进 制 转换 成 十 进 制 ， 总 是 首先 检测 符号 位 。 如 
果 是 0， 这 个 数 是 正 数 ， 可 以 按照 无 符号 数 表 示 进 行 转换 ; 如果 是 1， 这 个 数 是 负数 ， 可 选 的 
方法 有 两 种 。 一 种 是 通过 取 反 得 到 正 数 ， 然 后 再 按照 无 符号 数 的 法 则 ， 把 它 转换 成 十 进 制 。 

例 3.14 一 个 10 位 单元 的 内 容 为 11 1101 1010， 它 代表 的 十 进 制 数 是 什么 ? 符号 位 是 
1， 因 此 这 个 数 是 负数 ， 首 先 对 这 个 数 取 反 : 

NOT 11 1101 1010 = 00 0010 0101 


00 0010 0101 
ADD 00 0000 0001 


00 0010 0110 
00 0010 0110 (bin) = 32+4+2 = 38 (dec) 
因此 原始 的 二 进 制 数 一 定 是 38 的 负 值 ， 即 
11 1101 1010 (bin) = -38 (dec) 口 
男 一 种 方法 是 不 用 取 补 码 ， 直 接 转 换 ， 即 只 用 在 原始 二 进 制 数 中 为 0 的 那些 位 的 位 置 值 
相 加 ， 再 加 1。 这 个 方法 是 正确 的 ， 因 为 取 正 整数 补 码 的 第 一 步 就 是 按 位 取 反 。 那 些 本 来 对 
正 整 数 数值 有 贡献 的 1 变 为 了 0， 所 以 是 0 而 不 是 1 对 负 整 数 的 数值 有 贡献 。 


例 3.15 图 3-11 显示 的 是 11 1101 1010 (bin) 的 为 11 1101 1010 
0 的 位 置 ， 把 这 些 位 的 位 置 值 之 和 加 1 得 到 | | = 1 的 位 置 
1101 1010 (bin) = - (1+324+4+1) = -38 (dec) 4 的 位 置 
这 和 前 面 方 法 得 到 的 结果 是 一 样 的 。 口 \ 32 的 位 置 


图 3-11 11 1101 1010 (bin) 中 所 有 0 
3.2.3 Boh 的 位 置 值 


看 待 二 进 制 表示 的 男 一 种 方法 是 使 用 数 轴 。 图 3-12 展示 了 3 位 单元 的 无 符号 二 进 制 表 
示 的 数 轴 ， 能 够 表示 8 个 数字 。 


可 以 通过 在 数 轴 上 往 右 移动 进行 加 法 运算 。 例 如 ，4 加 3， 从 4 开始 往 右 移动 3 个 位 置 
得 到 7。 如 果 党 试 在 数 轴 上 6 加 3， 将 超出 最 右 端 。 如 果 用 二 进 制 进行 这 个 加 法 ， 将 得 到 不 


正确 的 结果 ， 因 为 结果 超出 了 范围 : 000 001 010 O11 100 101 110 111 
SS S S SS S S 
110 p i Z3 4g y3 
ADD 011 
C=1 001 图 3-12 3 位 无 符号 系统 的 数 轴 


把 无 符号 数 轴 在 3 和 4 之 间断 开 ， 把 右 半 部 分 移 到 左边 ， 这 样 可 以 得 到 补 码 的 数 轴 。 
3-13 显示 了 二 进 制 数 111 现在 和 000 相 邻 ， 之 前 是 ooo 001 010 011 100 101 110 111 
+7 (dec)， 现 在 是 -1 (dec). 

23 4 5,6 7 


即使 有 经 过 0， 加 法 仍然 是 通过 在 数 轴 上 向 右 移动 来 A’ | 
进行 的 。-2 加 3， 从 -2 开始 向 右 移动 3 个 位 置 得 到 1。 如 | Eo | 


果 用 二 进 制 计算 ,答案 在 范围 内 ， 因 此 是 正确 的 : a) 把 数 轴 从 中 间断 开 
110 100 101 110 111 000 001 010 011 
ADD 011 
C=1 001 4 «QB e -f G Gf @ 3 
这 些 位 和 无 符号 二 进 制 6 加 3 是 一 样 的。 我 们 注意 到 b) 将 右边 一 部 分 移 到 左边 


结果 虽然 在 表 数 范围 内 ， 但 是 进位 位 是 1。 在 补 码 表 示 中 ， 图 3-13 3 位 补 码 系统 的 数 轴 
进位 位 不 再 表示 加 法 的 结果 是 否 是 在 范围 内 。 

有 时 候 ， 只 考虑 移动 后 的 十 进 制 数 轴 ， 可 以 完全 避免 二 进 制 表示 。 图 3-14 展示 了 补 码 
数 轴 ， 用 等 值 的 无 符号 十 进 制 数 代替 二 进 制 数 。 这 个 例子 中 ， 每 个 存储 位 置 有 3 位 ， 因 此 最 
多 有 2 或 8 个 数 。 

现在 ， 从 0 到 3 的 无 符号 数 与 有 符号 数 是 一 样 的 。 此 外 ， 通 过 减 8 可 以 从 无 符号 数 得 到 
有 符号 负数 : 

7-8 = -1 4 5 6 7 O 1 2 3 

E ae, ‘ae See ew a Se 

5-3 =-3 

NPN 图 3-14 无 符号 十 进 制 数 的 补 码 数 轴 

例 3.16 假定 有 一 个 8 位 单元 ， 有 2 或 256 个 可 能 的 整数 值 ， 非 负数 从 0 到 127。 假 
设 采 用 补 码 表示 ，97 加 45 等 于 多 少 ? 以 无 符号 二 进 制 数 计算 ， 和 等 于 

97 +45 = 142 (dec, unsigned) 

但 用 在 补 码 表示 中 ， 这 个 和 为 

142 - 256 = -114 (dec, signed) 

注意 ， 这 样 的 结果 完全 避免 了 二 进 制 表 示 。 为 了 验证 结果 ， 背 先 把 97 和 45 转换 为 二 进 
制 并 相 加 : 

97 (dec) = 0110 0001 (bin) 

45 (dec) = 0010 1101 (bin) 


0110 0001 
ADD 0010 1101 


C=0 10001110 — 
符号 位 是 1， 因 此 这 是 一 个 负数 。 现 在 ， 确 定 它 的 数值 大 小 


104 
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NEG 1000 1110 = 0111 0010 (bin) 
= 114 (dec) 口 ] 
预期 的 结果 。 


3.2.4 溢出 位 


在 ISA3 层 上 二 进 制 存储 的 一 个 重要 特性 就 是 每 个 值 都 没有 与 之 相关 的 类 型 。 在 前 面 的 
例子 中 ， 和 1000 1110， 作 为 无 符号 数 解释 时 ， 它 是 142 (deec)， 但 作为 补 码 表示 解释 时 ， 它 


BE 


-114 (dec), 


当 CPU 对 两 个 存储 单元 的 内 容 相 加 时 ， 它 不 管 它们 的 类 型 ， 
加 法 法 则 。 对 于 无 符号 二 进 制 ， 


相应 地 设置 C 位 并 继续 往 下 走 。 由 软件 来 检测 相 加 后 的 C 位 ， 


尽管 位 模式 的 值 取决 于 它 的 类 型 ， 是 无 符号 还 是 补 码 ， 但 是 硬件 对 两 种 类 
型 不 加 以 区 分 ， 只 存储 位 模式 。 


只 采用 位 序列 上 的 二 进 制 


如 条 和 超出 表 数 范围 ， 硬 件 只 是 简单 存储 (不 正确 的 ) 结果 ， 


进位 发 生 ， 并 按 需 采取 适当 的 动作 。 
我 们 前 面 说 过 ， 在 补 码 二 进 制 表示 中 ， 进 位 位 不 再 表示 一 个 和 是 否 在 表 数 范围 内 。 当 运 


算 结 果 超 出 表 数 范围 时 ， 我 们 称 为 出 现 了 溢出 情 
标示 这 种 情况 ，CPU 中 有 男 一 个 用 V 表示 的 特殊 位 ， 
对 两 个 二 进 制 整数 相 加 时 ， 如 果 和 超出 补 码 表示 的 范围 ， 那 么 V 设置 为 1， 


为 0。 


况 ( overflow condition) 。 


看 是 否 在 最 高 位 的 那 一 列 有 


为 了 为 有 符号 数 


叫 作 溢出 位 (overflow bit)。 当 CPU 


否则 V 设置 


不 论 以 何 种 方式 解读 位 模式 ，CPU 总 是 执行 同样 的 加 法 运算 。 与 C 位 一 样 ， 如 果 发 生 
， 并 继续 它 的 下 一 步 工作 。 由 软件 来 检 


了 补 码 洲 出 ，CPU 不 会 停 下 来 ， 它 将 V 位 设置 为 


测 加 法 后 的 V 位 。 
例 3.17 这 里 有 几 个 6 位 单元 的 例子 ， 展 示 了 进位 位 和 YV 位 的 情况 : 
00 0011 01 0110 
两 个 正 数 相 加 : ADD 010101 ADD 00 1100 
V=0 011000 V=1 100010 
C=0 C=0 
00 0101 00 1000 
一 个 正 数 和 一 个 负数 相 加 : ADD 110111 ADD 11 1010 
V=0 111100  V=0 000010 
C=0 C=] 
11 1010 10 0110 
Aces | ADD 110111 ADD 100010 
两 个 负数 相 加 ; V=0 110001 V=1 001000 
C=] C=] 
注意 V 和 C 的 值 有 可 能 是 所 有 的 组 合 。 口 
怎样 才能 知道 发 生 了 溢出 情况 呢 ?” 一 种 方法 是 把 两 个 数 转 换 到 十 进 制 ， 两 者 相 加 看 它们 


的 和 是 否 超出 了 以 十 进 制 表示 的 范围 。 如 果 是 ， 那 就 是 发 生 了 洪 出 。 


硬件 通过 将 符号 位 的 进位 与 C 位 比较 来 检测 是 否 溢出 发 生 : 如 果 两 者 不 同 ， 滋 出 发 生 ， 


V 为 1; 


如 果 两 者 相同 ,V 为 0。 


不 将 符号 位 的 进位 与 C 位 比较 ， 也 可 以 通过 查看 加 数 与 和 的 符号 ; ferries 
了 洲 出 。 如 果 两 个 正 数 相 加 得 到 负数 或 者 两 个 负数 相 加 得 到 正 数 ， 那 么 就 发 生 了 溢出 ; 一 
正 数 和 一 个 负数 相 加 是 不 可 能 发 生 洲 出 的 。 
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3.2.5 负数 和 零 位 


除了 检测 无 符号 整数 溢出 情况 的 C 位 和 检测 有 符号 整数 溢出 情况 的 V 位 外 ，CPU 还 维 
护 了 另外 两 位 ， 供 软件 在 运算 后 进行 检测 。 它 们 是 N 位 和 Z 位 : N 位 用 于 检测 负数 结果 ，Z 
位 用 于 检测 零 结 果 。 总 的 来 说 ， 这 4 个 状态 位 的 困 数 是 
e N 二 1， 如 果 结 果 是 负数 。 
N = 二 0， 其 他 情况 。 
e Z 三 1， 如 果 结 果 全 是 零 。 
Z 二 0， 其 他 情况 。 
e V 二 1]， 如 果 有 符号 整数 溢出 发 生 。 
V 二 0， 其 他 情况 。 
e C 一 1， 如 果 无 符号 整数 溢出 发 生 。 
C 二 0， 其 他 情况 。 
由 于 N 位 是 符号 位 的 一 个 副本 ， 所 以 硬件 很 容易 确定 它 。 而 要 确定 Z 位 ， 人 硬件 则 要 费 
点 儿 工 夫 ， 因 为 它 必须 确定 结果 的 每 个 位 是 否 都 为 0。 第 10 章 展示 了 硬件 怎样 根据 结果 计 
算 状 态 位 。 
例 3.18 这 里 有 三 个 加 法 例子 ， 展 示 了 结果 的 4 个 状态 位 情况 。 


01 0110 00 1000 00 1101 
ADD 00 1100 ADD 111010 ADD 11 0011 
N=0 100010 N=0 00 0010 N=0 00 0000 
Z=0 Z=0 Z=1 
V=1 V=0 V=0 
C=0 C=] C=1 o 
3.3 ”二进制 运算 


因为 计算 机 中 所 有 信息 都 是 以 二 进 制 存储 的 ， 所 以 CPU 就 用 二 进 制 运算 来 处 理 这 些 信 
息 。 前 面 章 节 提 到 了 NOT、ADD 和 NEG 这 些 二 进 制 运算 : NOT 是 逻辑 运算 符 ，ADD 和 
NEG 是 算术 运算 符 。 本 节 我 们 再 讲 一 些 其 他 的 在 计算 机 CPU 中 有 用 的 逻辑 和 算术 运算 符 。 


3.3.1 逻辑 运算 符 


我 们 熟悉 逻辑 运算 AND 和 OR。 男 一 个 逻辑 运算 符 是 异 或 ， 写 作 XOR。 若 p 为 真 ,或 
者 9 为 真 ， 但 不 同时 为 真 ， 那么 p 和 9g 的 异 或 逻辑 值 为 真 。 即 ，P 一 定 真 异 于 g， 或 者 g 必 
MAFF Po 

二 进 制 数字 一 个 有 趣 的 属性 是 可 以 把 它们 作为 逻辑 值 来 解读 。 在 ISA3 层 ， 位 为 1 表示 
真 ， 位 为 0 表示 假 。 图 3-15 展示 了 AND, OR 和 XOR 运算 符 在 ISA3 层 的 真 值 表 。 


Cp [a [Proa 
To fo 





Al 3-15 ISA3 HE AND, OR 和 XOR 运算 符 的 真 值 表 
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Æ HOL6 Je, AND 和 OR 对 值 为 真 或 假 的 布尔 表达 式 运 算 ， 用 在 if 语句 和 循环 中 来 测 
试 控制 语句 执行 的 和 条件。 下面 的 C++ 语句 是 AND 运算 符 的 一 个 例子 

if ((ch >= 'a') && (ch <= 'z')) 

KI 3-16 Æ AND, OR 和 XOR 在 HOL6 EMAAR, E AIA 3-15 是 一 样 的 ，ISA3 层 的 
1 对 应 HOL6 层 的 true (E), ISA3 层 的 0 对 应 HOL6 层 的 false ( 假 )。 


| Pp 
| true | true | tme | | true | 
false | true false 
| false | 


E 





K| 3-16 HOL6 层 上 AND, OR 和 XOR 运算 符 的 真 值 表 


由 于 不 涉及 进位 ， 所 以 逻辑 运算 比 加 法 更 容易 执行 。 对 序列 中 的 对 应 位 进行 遂 位 运算 。 
逻辑 运算 对 进位 位 和 溢出 位 都 没有 影响 。 
例 3.19 一 些 6 位 单元 的 例子 是 


01 1010 01 1010 01 1010 
ADD 01 0001 OR 010001 XOR 01 0001 

N=0 01 0000 N=0 01 1011 N=0 00 1011 

Z=0 X=0 A 

注意 ， 如 果 把 1 与 1 做 ANDA, GRE1, 没有 进位 。 口 


每 个 AND、OR 和 XOR 运算 用 两 组 位 来 产生 结果 ， 不 过 NEG 运算 仅 对 一 组 位 进行 ， 
因此 称 为 一 元 运算 (unary operation). 


3.3.2 ”寄存 器 传送 语言 


寄存 需 传 送 语言 (RTL) 的 目的 是 精确 指定 硬件 操作 的 结果 。 如 果 学 习 过 逻辑 学 ， 你 会 
熟悉 RTL 符号 。 图 3-17 展示 了 RTL 符号 。 

在 逻辑 学 中 ，AND 和 OR 运算 称 为 合 取 (conjunction) 和 析 取 (disjunction), NOT 运算 
IFERN TE (negation), Aa (implies) 运算 符 可 以 翻译 为 英语 “if/then”( 中 文 “ 如 果 / 那 
么 ”)。 传 递 (transfer) 运算 符 是 与 C++ 中 赋值 
运算 符 = 等 效 的 硬件 。 运 算 符 左边 的 内 存单 元 获 
得 运算 符 右 边 的 量 。 位 索引 运算 符 把 内 存单 元 当 
做 数组 ， 最 左边 的 位 是 索引 0， 与 C++ 索引 数组 
元 素 一 样 。 当 形式 化 描述 不 够 时 ， 可 以 用 非 形式 
化 的 语言 描述 ， 用 大 括号 括 起 来 。 













有 两 种 分 隅 符 : 一 个 是 顺序 分 隔 符 (sequential 
separator) (分 号 )， 用 来 分 隔 一 个 接 一 个 发 生 的 
两 个 动作 ; 另 一 个 是 并 发 分 隔 符 (concurrent 
separator) (i=) 用 来 分 隔 同时 发 生 的 两 个 动作 。 E aa 
例 3.20 在 例 3.19 的 第 3 个 计算 中 ,假设 Conen separator | > 





第 一 个 6 位 单元 用 a 表示， 第 二 个 6 位 单元 用 b 图 3-17 寄存 器 传送 语言 的 运算 及 其 符号 表示 


RI, WRN c, WWA XOR 运算 的 RTL 表述 是 
c—a@®bsNec<0,Z<—c=0 
首先 ，c 获得 a 和 6。 的 异 或 ， 这 个 动作 完成 后 ， 下 面 这 两 个 动作 同时 发 生 : NN 获得 一 个 


布尔 值 ，Z 获得 一 个 布尔 值 。 当 c < 0 时 ,布尔 表达 式 c < 0 为 1， 否则 为 0。 回 
3.3.3 ”算术 运算 符 


另外 还 有 两 个 一 元 运算 符 : ASL 表示 算术 左 移 (arithmetic shift left) 和 ASR 表示 算术 右 移 
( arithmetic shift right)。 如 同 ASL 这 个 名 字 暗 示 的 ， 单 元 中 每 位 往 左 移动 一 个 位 置 ， 最 左边 
的 位 移动 到 进位 位 ， 而 最 右边 的 位 得 到 0。 图 3-18 展示 了 一 个 6 位 单元 的 ASL 运算 的 动作 。 

例 3.21 下 面 是 3 个 算术 左 移 的 例子 。 

ASL 11 1100 = 11 1000, N=1226 6.0 =1 

ASL 00 0011 = 00 0110, N=O.Z2=6V=0,C=6 

ASL 01 0110 = 10 1100, 评语 二 口 

这 个 运算 称 为 算术 移 位 ， 因 为 当 这 些 位 用 作 整 数 表 示 时 ， 它 的 结果 类 似 于 算术 操作 。 假 
设 用 无 符号 二 进 制 表示 ， 前 面 例 子 中 3 个 整数 在 移动 前 是 

60 3 22 (dec，unsigned ) 
BERA EEEE] 

56 6 44 (dec, unsigned) 
ASL 的 结果 是 原 数 的 2 倍 。 因 为 120 超出 6 位 单元 能 表 图 3-18 6 MRIN ASL ERITA 
示 的 整数 范围 ， 所 以 ASL 不 能 把 60 翻 倍 。 当 把 二 进 制 序列 看 作 无 符号 整数 时 ， 如 果 移 动 后 
进位 位 是 1， 则 发 生 溢出 。 

在 十 进 制 中 ， 左 移 产生 同 样 的 结果 ， 只 是 整数 被 乘 以 10 而 不 是 2。 例 如 ， 对 356 进行 
十 进 制 的 ASL 会 得 到 3560， 它 是 原 数值 的 10 倍 。 

如 果 把 数 解释 为 补 码 表示 会 是 什么 情况 呢 ? 那么 移动 前 3 个 整数 是 

-4 3 22 (dec, signed) 
移动 后 成 为 

-8 6 -20 (dec, signed) 
同样 ， 尽 管 是 负数 ，ASL 的 结果 仍然 是 原 数 的 2 倍 。 这 次 ，ASL 不 能 把 22 翻 倍 ， 假 定 用 补 
码 表示 ，44 超出 了 范围 。 这 个 溢出 情况 使 得 V 位 被 设置 为 1。 这 个 情形 与 加 法 运算 中 C 位 
检测 到 无 符号 值 溢 出 相似 ， 需 要 用 V 位 来 检测 有 符号 值 的 溢出 。 

对 6 位 单元 r 进行 算术 左 移 的 RTL 表述 为 

C= pele, re 4 Fel rie = GC: 
Nr, me} 

同时 ，C 获得 + 最 左边 的 位 ,r+ 最 左边 的 5 位 直接 获得 它们 紧邻 着 的 右边 位 的 值 ， 最 右边 一 位 
获得 0。 移 位 之 后 ， 根 据 z 的 新 值 设 置 状 态 位 N、Z 和 V。 区 分 分 号 和 逗号 是 很 重要 的 : 分 号 隔 开 
两 个 事件 ， 每 个 事件 有 3 个 部 分 ; 在 每 个 部 分 内 ， 逗 号 
隔 开 同时 发 生 的 事件 。 大 括号 非 形式 化 地 表示 当 把 值 1 eee 
当 作 有 符号 整数 时 ， 根 据 结果 是 否 溢出 对 V 位 进行 设置 。 

E ASR 运算 中 ， 组 中 每 个 位 往 右 移动 一 个 位 置 ， 
最 低 有 效 位 移 到 进位 位 ， 最 高 有 效 位 保持 不 变 。 图 3-19 图 3-19 6 位 单元 上 的 ASR 运算 的 行为 
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展示 了 一 个 6 位 单元 的 ASR 运算 的 动作 。ASR 运算 不 会 影响 V 位 。 
例 3.22 下 面 是 4 个 算术 右 移 的 例子 。 
ASR 010100 = 001010, N=0,Z=0,C=0 
ASR 010111=001011, N=0,Z=0,C=1 


ASR 11 0010 = 11 1001, N=1,Z=0,C=0 

ASR 11 0101 = 11 1010, N=1,Z=0,C=1° G 

ASR 运算 是 特意 为 补 码 表 示 设 计 的 ， 因 为 符号 位 保持 不 变 ， 负 数 仍 然 是 负数 ， 正 数 仍 
然 是 正 数 。 

往 左 移 1 位 是 原 数 乘 以 2， 反 之 往 右 移 1 位 是 原 数 除 以 2。 在 前 面 例子 中 ， 移 动 前 4 个 
整数 为 

20 23 -14 -11 (dec, signed) 
移动 后 是 


10 11 -7 -6 (dec, signed) 
偶数 正好 可 以 被 2 整除 ， 因 此 ASR 对 它们 的 结果 没什么 疑问 。 当 奇数 除 以 2 时， 结果 总 是 
癌 下 取 整 。 例 如 ，23 二 2 = 11.5, 11.5 W PRBA 11, A, -11+2 = -5.5, -5.5 m] FH 
整 为 -6。 注 意 ， 因 为 在 数 轴 上 -6 在 -5.5 左边 ， 因 此 它 小 于 -5.5。 


3.3.4 ”循环 移 位 运算 符 


和 算术 运算 符 相 比 ， 循 环 移 位 运算 符 不 会 把 二 进 制 序列 看 作 整 数 ， 因 此 循环 移 位 运算 
不 会 影响 N、Z 和 YV 位 ， 而 只 会 影响 C 位 。 有 两 种 循环 移 位 运算 符 : 表示 为 ROL 的 循环 左 
移 和 表示 为 ROR 循环 右 移 。 图 3-20 展示 了 6 位 单元 的 循环 移 位 运算 符 的 动作 。 循 环 左 移 类 
似 于 算术 左 移 ， 在 循环 左 移 中 C 位 会 循环 移 到 单元 的 最 右边 
位 ， 而 在 算数 右 移 中 是 0。 循 环 右 移 是 在 相反 的 方向 做 同样 的 一 
vin Ht EEE 
6 位 单元 循环 左 移 的 RTL 表述 是 D 循环 左 移 运算 
Cer 0) .¢ (04) er (1.45) Fs) —< ë 


例 3.23 下 面 是 4 个 循环 移 位 运算 的 例子 。 | >|>|>|>|>} | 
C=1, ROLO1 1101 = 111011, C=0 E 


C=0, ROLO1 1101 = 11 1010, C=0 b) 循环 右 移 运算 
C=1, RORO11101= 101110, C= 1 图 3-20 循环 运算 的 行为 
C=0, ROR 01 1101 = 00 1110, C=1 

左边 是 循环 移 位 前 的 C 值 ， 而 右边 是 循环 移 位 后 的 C 值 。 o 


3.4 十 六 进 制 和 符号 表示 


前 面 章节 中 的 二 进 制 表示 是 整数 表示 ， 本 节 介绍 另 一 种 基数 ， 将 用 于 下 一 章 中 介绍 的 计 
算 机 。 本 章 还 将 介绍 这 种 计算 机 是 如 何 存储 字母 信息 的 。 


3.4.1 六 进 制 


假定 一 个 人 有 16 根 手指 而 不 是 10 根 。 那 么 发 明 阿 拉 人 数字 时 ， 会 发 生 什么 情况 呢 ? ic 
得 10 根 手 指 模式 是 从 0 开始 ， 一 直 继续 发 明 新 的 符号 1、2， 直 到 倒数 第 二 根 手 指 9， 接 着 


在 最 后 一 根 手指 ， 把 1 和 0 结合 在 一 起 表示 下 一 个 数 10。 

如 果 是 16 根 手 指 ， 当 达到 9 时 ， 仍 然 还 剩 下 不 少 的 指头 ， 必 须 继续 发 明 新 的 符号 ， 这 
些 额 外 的 符号 通常 用 英语 字母 表 开 头 的 字母 表示 ， 因 此 以 16 为 底 〈 十 六 进 制 ， 或 缩写 为 
hex) 的 计数 是 这 样 的 : 


0 7 E 6 iC 2 
1 8 F 16 fò 24 
2 9 10 17 1E 235 
3 A 11 18 IF 26 
4 B 12 #19 20 
s ÈE B iA i 
6 D 14 1B 22 
当 十 六 进 制 数字 包含 许多 位 时 ,计数 就 有 点 儿 麻 烦 。 思 考 从 8BE7、C9D 和 9FFE 开始 
8BE7 C9D 9FFE 
8BE8 C9E 9FFF 
8BE9 C9F A000 
8BEA CAO A001 
8BEB CAI A002 
8BEC CA2 A003 


当 写 八进制 数 时 ， 数 字 看 上 去 有 比 它 们 实际 要 大 的 趋势 ; 写成 十 六 进 制 数 时 ， 效 果 是 相 
反 的 ， 数 字 有 看 上 去 比 它们 实际 要 小 的 趋势 。 比 较 十 六 进 制 数 的 列表 和 十 进 制 数 的 列表 ， 可 
以 看 出 18 (hex) 实际 上 是 24 (dec). 


3.4.2 ”基数 转换 


在 十 六 进 制 中 ， 每 个 位 置 值 都 是 比 它 低 一 位 的 位 置 值 的 16 倍 。 十 六 进 制 转 换 为 十 进 制 ， 
可 以 简单 地 把 位 置 值 乘 以 该 位 置 的 数字 ， 并 相 加 。 gpg 


例 3.24 图 3-21 给 出 了 把 8BE7 从 十 六 进 制 sie Ix js 7 
转换 到 十 进 制 的 过 程 。B 的 十 进 制 值 是 11，E 的 16 的 位 置 14x 16= 224 


十 进 制 值 是 14. 口 tw et 
从 十 进 制 转 换 到 十 六 进 制 的 过 程 类 似 于 从 十 pae a 


进 制 转换 到 二 进 制 的 过 程 ， 不 过 不 是 一 个 接 一 个 a) 8BE7 的 位 置 值 b) 把 8BE7 转 换 为 十 进 制 
地 除 以 2， 而 是 除 以 16， 并 保存 余数 的 记录 ， 这 , 
图 3-21 将 十 六 进 制 数 转换 为 十 进 制 
些 余 数 就 是 转换 后 的 十 六 进 制 数 。 
对 于 小 于 255 (dec) 或 FF Chex) 的 数 ， 两 种 进 制 互相 转换 用 图 3-22 所 示 的 表格 是 很 容 
易 做 到 的 。 表 中 的 主体 是 十 进 制 数 ， 左 列 和 顶 行 是 十 六 进 制 数 。 


.lo ll2ls 4 sitet 7{eftotate}c}olele | 
poo | of a} 2} 3} 4| st of 7] a] of wf mu] 2] 3] | is | 
i- | 6 | 17 | 18 | to | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 
2- | 32 | 33 | 34 | 35 | 36 | 37] 38 | 39 | 40 | aja |43| 4 | as | a | 47 | 


图 3-22 十 六 进 制 转换 表 











74 PERD OBRAZA (F3ZB) 


-PEPR E eT 
ras [sof sr | so] ss | se] ss | so 
res [oo] | || m[n| nl] 
rs [eo | e1 | s2 | es | sa | ss | eo] a7] e 
e oe or | 95 o [oo [ior Tio fos fior 
EA 


7 Tae Ps [ne [is [us [ar [ue [ns lo [ar li [is 
ro 


a [as [as [rer [rae [vas [aso [asi [ose [oss [ose [ass [ise [oer [ose [iss 
a [ieo [rei [162 [163 |164 [165 [166 |167 [168 [169 [rv [an fi [ars [ie [ars 
B [ir [arr [ine [v9 [iso [isi [isa [iss [ise [ves [ise | 157 [ise fiso fioo fior 
re fisa [iss [ise [iss [196 [197 [198 | 199 [200 | 201 [202 [203 [204 [20s [206 [207 
o foo [200 [210 [an [212 [ais [aia [ais [216 [217 [aie [a19 [220 [221 [220 [223 
Te. [224 [22s [226 [227 [228 [220 [230 [s1 |232 |233 | 254 [235 [236 [237 | 258 [239 


图 3-22 ( 续 ) 


例 3.25 把 9C (hex) 转换 到 十 进 制 ， 查 看 9 行 和 C 列 找到 156 (dec); 把 125 (dec) 
转换 到 十 六 进 制 ， 在 表 的 主体 中 找到 125， 从 对 应 的 
左 列 和 项 行 得 出 7D (hex). 口 

如 果 计 算 机 以 二 进 制 格式 存储 信息 ， 那 么 为 什么 
要 学 习 十 六 进 制 呢 ? 答案 是 ， 二 进 制 和 十 六 进 制 之 间 
存在 特殊 关系 ， 如 图 3-23 所 示 。4 位 有 16 种 可 能 的 
组 合 ， 而 正好 有 16 个 十 六 进 制 数 字 ， 每 个 十 六 进 制 
数字 代表 这 4 位 。 

为 了 节约 打印 空间 ， 位 模式 经 常 被 写成 十 六 进 制 形 
式 。 一 个 16 位 机 器 的 手册 可 能 会 说 某 个 内 存 位 置 包 含 
01D3， 这 要 比 说 它 包含 0000 0001 1101 0011 简短 多 了 。 

把 无 符号 二 进 制 转换 到 十 六 进 制 ， 从 最 右边 开 
始 把 位 划分 为 每 4 个 一 组 ， 给 每 组 一 个 图 3-23 对 应 的 十 六 进 制 数字 。 把 十 六 进 制 转换 到 无 
符号 二 进 制 ， 简 单 地 把 过 程 反 过 来 即 可 。 

3.26 写 出 10 位 无 符号 二 进 制 数 10 1001 1100 的 十 六 进 制 形 式 ， 从 最 右边 的 4 位 
1100 开始 : 

10 1001 1100 (bin) = 29C (hex) 口 

由 于 10 位 不 能 刚好 分 为 4 个 一 组 ， 所 以 在 图 3-23 中 查找 最 左边 的 数字 时 ， 在 前 面 加 2 
个 0。 在 本 例 中 ， 最 左边 的 十 六 进 制 数字 来 自 

10 (bin) = 0010 (bin) = 2 (hex) O 

例 3.27 对 于 14 位 单元 

0D60 (hex) = 00 1101 0110 0000 (bin) 

注意 ， 最 末尾 的 十 六 进 制 0 代表 4 个 二 进 制 0， 而 最 高 位 的 十 六 进 制 0 只 代表 2 个 二 进 
制 0。 口 

把 十 进 制 转换 为 无 符号 二 进 制 ， 你 可 能 想 要 用 十 六 进 制 - 十 进 制 表 作 为 中 间 步 又 。 通 过 查 
找 图 3-22 中 的 十 六 进 制 值 ， 不 用 任何 计算 ， 再 根据 图 3-23 把 每 个 数字 转换 为 二 进 制 即 可 。 








图 3-23 十 六 进 制 和 二 进 制 之 间 的 关系 
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例 3.28 对 于 6 位 单元 ， 

29 (dec) = 1D (hex) = 01 1101 (bin) 

转换 中 的 每 一 步 都 是 一 次 简单 的 查 表 。 口 

在 机 器 语言 程序 代码 或 程序 记录 中 ， 几 乎 不 会 把 数字 写成 有 负 号 的 十 六 进 制 形式 ， 而 是 
把 符号 位 隐 含 地 包含 在 十 六 进 制 表示 的 位 模式 中 。 你 必须 牢记 十 六 进 制 只 是 二 进 制 序列 的 一 
个 方便 的 缩写 ， 硬 件 只 存储 二 进 制 值 。 

例 3.29 如 果 一 个 12 位 的 内 存 位 置 包含 F7A (hex)， 那 么 通过 思考 下 面 的 位 模式 可 以 
得 出 十 进 制 数 。 

F7A (hex) = 1111 0111 1010 (bin) 

符号 位 是 1， 因 此 这 个 数 是 负数 ， 转 换 为 十 进 制 是 

F7A (hex) = -134 (dec) 


注意 ， 尽 管 可 以 解释 成 一 个 负数 ， 但 是 十 六 进 制 数 不 会 写成 有 负 号 的 形式 。 口 
3.4.3 字符 


因为 计算 机 内 存 是 二 进 制 的 ， 所 以 字母 字符 必须 要 编码 后 才能 存储 到 内 存 中 。 美 国信 息 
交换 标准 代码 (American Standard Code for Information Interchange, ASCII) 是 一 个 使 用 广 
泛 的 字母 字符 二 进 制 编码 。 

ASCI 包含 所 有 大 写 和 小 写 的 英文 字母 、10 个 数字 和 特殊 符号 (例如 ， 标 点 )。 它 的 一 
些 符号 是 不 能 打印 的 ， 主 要 用 于 在 计算 机 之 间 传 递 信 息 或 用 于 控制 外 围 设备 。 

ASCI 是 一 种 7 位 的 编码 。 因 为 7 位 有 2’=128 种 可 能 的 组 合 ， 所 以 有 128 个 ASCII 字 
IF, 图 3-24 给 出 了 所 有 这 些 符号 。 表 中 第 一 列 是 不 可 打印 的 符号 ， 它 们 的 意思 列 在 表 下 ， 
表 中 其 余部 分 是 可 打印 的 符号 。 

例 3.30 代表 响 铃 (bell) 的 序列 000 0111 使 终端 发 出 哗 哗 声 。 另 一 个 例子 是 一 组 
命令 ， 用 于 控制 纸张 打印 机 在 新 的 一 行 起 始 开 始 打 印 。 计 算 机 发 送 一 个 回 车 符 (CR，000 
1101 )， 再 发 送 一 个 换行 符 (LF, 000 1010), CR 使 得 “打印 头 ”或 光标 回 到 纸张 的 左边 ， 
LF 使 纸张 往 下 走 一 行 。 口 

例 3.30 名 字 Tom 会 以 下 列 ASCH 形式 存储 ， 

101 0100 

110 1111 

110 1101 
如 果 将 这 个 位 序列 发 送 到 输出 终端 ， 就 会 显示 “Tom”。 口 

例 3.32 街道 地 址 52 E1m 会 以 下 列 ASCH 形式 存储 ， 

011 0101 

011 0010 

010 0000 

100 0101 

110 1100 

110 1101 
2 和 E 之 间 的 空格 是 一 个 独立 的 ASCI 字符 。 o 

尽管 ASCII 使 用 广泛 ， 但 它 绝 对 不 是 表示 字符 的 唯一 编码 。 由 于 这 种 7 位 编码 没有 提 
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供 除 英语 外 其 他 语言 中 常见 的 重音 符号 ， 因 此 它 的 使 用 是 有 限 的 。 由 于 这 个 限制 ， 所 以 对 其 
做 了 扩展 ， 使 用 8 位 来 提供 很 多 7 位 无 法 表示 的 重音 符号 。 


六 进 抽 六 进 抽 





六 进 制 










NUL |0000000| 00 | rsp [oro 0000 20 Te | 1000000| 4 et a 
son [oooo00| or || + [owooo0| 21 |f a | 1000001] a1 || a [mooo] or 
srx [ooo 0010] o2 ||- [ooo] 22 | e | vooo0| 42 || » [noor] @ _ 
ETX |ooooo1| 03 || # [ooo] 23 || c | 1oooo1| 43 || c 1100011] 6 | 
EOT |o000100| 04 || s [oiooio0| 24 || b | 1000100] 44 || a _|1100100| 64 | 
ENQ |o000101| 05 ||% |ol0olol| 25 || e | 1000101 | 45 || e |loooll 65 | 
ack [ooo] 0 || & [ooonol 26 | F [iooonol 46 || + [noono] 66 
BEL |oooomi| 07 || looom| 27 || e | wooo] 47 || g luoom| 67 | 
Bs loool o8 || © |o101000| 28 || u [ioo1000| 48 || n [110 1000| 68 | 
HT |ooo1001| 09 || > [oro1001| 29 || x |1001001| 49 || i [ioio] 69 | 
IF |oo01010| oa || * |o0100| 2a || a | 1001010] 4a || 3 [noi| 6a _| 
vr |oooion] o || + [orion] 2B || k Jio0101| 4B || k [uoin] 6B 
FF |0oo01l00| oc || , [oromoo] 2c f| t | 100100} 4c || [nonoo sc | 
cR |oo0oio01| oD ||- loouo| 2D || m |10011101] 4D || m [nonoi] 6D 
so |ooll0| oœ || . [oomo] 2E || n |1010 4 || n [uomo 6E | 
[sion [oF J7 Tou] æ [o fiom] e I e luonn| e 
DE [001 0000] 10 || o [onoo] 30 || e [ioroooo| so |f [iooool 7% 
_DC1 |o010001| 1 | | a | 1010001 | 51 | Pa Ture a 
Dc2 [oorooi0| 12 || 2 [oro] 32 || R | 1010010] 52 || r lo 72 | 
Dc3 [ooroo| 13 J| 3 jouoon| 33 || s | ioroo| 5 || s no 73 | 
Dc4 |0010100| 14 || 4 |olloloo| 34 || t | 1010100] 54 | 
Nak [oor] 1s || s [onoo] 3 | u [room| 5 |u puroa) 75 _ 
syn |oorono| 16 || 6 [ooo] 36 || v [101010] se || vonol 76 
ems [oromi] 17 || 7 Jonom] 37 |w fioom| s7 |w fiom] 7 
CAN |oo11000| 18 || a [om 1000| 38 || x | 1011000] ss || x f1 1000| 78 | 
EM_|o011001| 19 || 9 jouiool| 39 || y | 1011001] 59 | FAUTO ES 
sus [ooroo] 1a ||: [onion] sa || z [iorno] sa jz [mioo] 7 
Esc ol 1B ||; jour] 3B || c [room| 58 | NTT E 
rs forno| ic || < [onno] sc | x fomool sc |i [mno] 7c _ 
Gs [oorno 1D || = [onno] 3D || 3 [ionoj so f|» [muo] wD 
RS w |> [onmo] æ | > fomol se ||- [mmo] Œ | 
E Cor |e los- [ponm] se os 7 
控制 符 的 缩写 
NUL ZFA FF 换 页 键 CAN UH 
SOH 标题 开始 CR 回 车 键 EM 介质 中 断 
STX 正文 开始 SO 不 用 切换 SUB 替补 
ETX 正文 结束 SI 启用 切换 ESC PRS (Yat HH) 
EOT 传输 结束 DLE 数据 链 路 转 义 FS 文件 分 割 符 
ENQ 请 求 DCI 设备 控制 1 GS 分 组 符 
ACK 收 到 通知 DC2 设备 控制 2 RS 记录 分 离 符 
BEL 响 铃 DC3 设备 控制 3 US 单元 分 隔 符 
BS 退 格 DC4 设备 控制 4 SP 空格 
HT 水 平 制 表 符 NAK 拒绝 接收 DEL 删除 
LF 换行 键 SYN 同步 空 朵 
VT 垂直 制 表 符 ETB 传输 块 结束 


图 3-24 美国 信息 交换 标准 代码 (ASCII) 


但 即便 有 了 这 个 扩展 仍 不 足以 处 理 非 拉丁 字符 。 由 于 全 球 信 息 交 流 的 重要 性 ， 所 以 发 
明了 一 种 称 为 Unicode (统一 码 ) 的 标准 。Unicode 的 目标 是 可 以 对 世界 上 所 有 语言 的 符号 
进行 编码 ， 甚 至 包括 已 经 不 再 使 用 的 古语 言 。Unicode 符号 集合 使 用 32 位 或 4 字 节 。 由 于 
大 多 数 的 应 用 不 会 用 到 这 些 符 号 中 的 大 多 数 ， 所 以 Unicode 标准 制定 了 使 用 小 于 4 字 市 的 技 
术 。 基 本 多 文 种 平面 (Basic Multilingual Plane) 包含 常用 的 Unicode 字符 ， 每 个 字符 仅 占 用 
2 字 节 。 用 它 来 存储 1 字 节 的 扩展 ASCH 码 ， 所 需 存储 空间 是 其 两 倍 。 不 过 基本 多 文 种 平面 
实际 上 包含 了 世界 上 所 有 的 书面 语言 ， 包 括 阿 拉 伯 语 、 亚 美 尼 亚 语 、 汉 语 、 西 里 尔 语 、 硕 脂 
语 、 希 伯 来 语 、 日 语 、 韩 语 、 低 利 亚 语 、 许 多 非洲 语言 ， 其 至 加 拿 大 土著 语言 模式 。 


3.5 浮 点 数 表示 


本 章 前 面 几 节 描述 的 数值 表示 是 对 于 整数 值 的 。C++ 有 3 种 数值 类 型 有 小 数 部 分 : 

e float 单 精度 浮 点 数 

e double 双 精 度 浮 点 数 

e long double 长 双 精 度 浮 点 数 

这 些 类 型 的 值 在 ISA3 层 不 能 以 补 码 的 形式 存储 ， 因 为 存储 必须 提供 存放 数字 中 小 数 点 
位 置 的 方式 。 浮 点 数值 用 科学 计数 法 的 二 进 制版 本 来 存储 。 


3.5.1 ”二进制 小 数 


二 进 制 小 数 有 一 个 二 进 制 小 数 点 ， 它 是 十 进 制 小 数 点 的 二 进 制版 本 。 
例 3.33 图 3-25a 展示 了 101.011 (bin) 的 位 置 值 。 二 进 制 小 数 点 左边 的 位 与 图 3-2 无 符 
号 二 进 制 表示 中 相应 的 位 有 相同 的 ，。;， 。 1 ， 


位 置 值 。 二 进 制 小 数 点 右边 的 位 置 tf ， 机 
EM 1/2 开始 ， 每 个 位 置 值 是 前 一 ] % 的 位 置 1 % 的 位 置 二 0.125 


i Vay te 1 % 的 位 置 =0.25 

位 的 一 半 。 图 3-25b 给 出 的 加 法 表 ores 0 ARLE =—0.0 

明 得 到 的 值 是 5.375 (dec). 器 nie 1 1 的 位 置 =1.0 

图 3-26 是 有 小 数 部 分 数字 的 多 opg 。 0 2 的 位 置 =00 
项 式 表示 。 小 数 点 左边 一 位 的 位 轩 aia eo 


值 总 是 基数 的 0 次 方 ， 即 1。 往 左下 a) 101.011 (bin ) 的 位 置 值 b) 把 101.011 (bin) 转换 为 十 进 制 
一 个 有 效 位 是 基数 的 1 次 方 ， 即 基 图 3-25 “把 二 进 制 小 数 转换 为 十 进 抽 
数 本 身 。 小 数 点 右边 一 位 的 位 置 值 
是 基数 的 一 1 次 方 ， 往 右 下 一 个 有 效 位 是 基数 的 -2 次 方 ， 右 边 每 个 位 置 值 是 它 左 边 位 位 置 值 
的 1/ 基数 倍 。 

确定 二 进 制 小 数 的 十 进 制 值 分 为 两 步 。 首 先 ， 用例 3.3 中 无 符号 二 进 制 数 转换 的 方法 转 
换 二 进 制 小 数 点 左边 的 位 。 然 后 ， 用 逐 位 翻 倍 的 算法 转换 二 进 制 小 数 点 右边 的 位 。 

例 3.34 图 3-27 展示 了 把 6.585 937 5 (dec) 转化 为 二 进 制 的 过 程 。 转 换 整 数 部 分 就 
是 转化 小 数 点 左边 的 110 (bin); 转换 小 数 部 分 是 把 小 数 点 右边 的 数字 写 在 表格 右 列 的 头 部 ， 
小 数 部 分 乘 以 2， 小数点 左边 的 数字 写 在 左 列 ， 小 数 部 分 写 在 右 列 。 下 次 乘 2 时 ， 不 包括 整 
数 部 分 。 例 如 ,把 .171 875 Fe 2 得 到 0.343 75， 而 不 是 把 1.171 875 乘 2。 左 列 从 上 到 下 的 
数字 就 是 二 进 制 小 数 部 分 从 左 到 右 的 位 ， 因 此 6.585 9375 (dec) = 110.100 101 1 (bin), O 

把 小 数 部 分 从 十 进 制 转换 到 二 进 制 的 算法 就 像 是 把 整数 部 分 从 十 进 制 转换 到 二 进 制 算法 
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的 镜像 。 图 3-5 给 出 了 用 逐 位 除 以 2 的 算法 转换 十 进 制 整数 的 过 程 。 除 法 的 余数 就 是 得 到 的 
数字 位 ， 顺 序 是 从 二 进 制 小 数 点 开始 从 右 往 左 。 用 逐 位 乘 以 2 的 算法 转换 小 数 部 分 ， 乘 法 得 
到 的 整数 部 分 是 生成 的 数字 位 ， 顺 序 是 从 二 进 制 小 数 点 开始 从 左 往 右 。 


.3859375 


1 6.5859375 
ix rox? 1x2°+0x27'4+1x274+1x22 


a) 二 进 制 数 101.011 





5 x 107+0 x 10'+ 6x 10°+7x10-'+2 x 107 +1x 10° 6 (dec) = 110 (bin) l 0 
b) 十 进 制 数 506.721 a) 转换 整数 部 分 b) 转换 小 数 部 分 
RI 3-26 浮 点 数 的 多 项 式 表示 图 3-27 把 十 进 制 小 数 转 换 为 二 进 制 数 


一 个 可 以 用 有 限 位 十 进 制 表 示 的 数 ， 它 的 二 进 制 数 表示 可 能 是 无 限 位 的 。 

例 3.35 图 3-28 展示 的 是 把 0.2 (dec) 转换 为 二 进 制 的 过 程 。 第 一 次 乘 2 得 到 0.4， 反 
复 几 次 后 又 得 到 了 0.4。 显 然 这 个 过 程 不 会 终止 ， 所 以 0.2 (dec) = 0.001100110011... (bin), fiz 
模式 0011 会 不 断 重复 。 a 

由 于 所 有 计算 机 单元 都 只 能 存储 有 限 的 位 ， 所 以 0.2 (dec) 
不 能 被 精确 存储 ， 必 定 是 一 个 近似 值 。 我 们 应 该 意识 到 由 于 二 
进 制 表 示 值 的 固有 舍 人 人 误差， 所 以 如 果 用 像 C 这 样 的 HOL6 
层 语言 做 加 法 0.2 + 0.2， 也 许 不 会 精确 得 到 0.4。 正 是 由 于 这 个 
原因 ， 好 的 数值 软件 几乎 不 会 检测 两 个 浮 点 数 是 否 完 全 相等 ， 
而 是 用 软件 维护 了 一 个 很 小 的 非 零 容忍 值 ， 用 以 表示 如 果 两 个 
浮 点 数 的 差 小 于 该 值 就 被 看 作 相 等 。 如 果 容 忍 值 是 0.0001， 那 么 
1.382 64 和 1.382 67 会 被 认为 是 相等 的 ， 因 为 它们 的 差 0.000 03 图 3-28 一 个 具有 无 休止 的 
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小 于 容忍 值 0.0001。 en 
3.5.2 WRR 


可 以 用 和 常见 于 十 进 制 数 的 科学 计数 法 的 二 进 制版 本 来 表示 浮 点 数 。 一 个 以 科学 计数 法 表 
示 的 非 零 数 是 规格 化 的 ， 如 果 它 的 第 一 个 非 零 位 正好 在 小 数 点 左边 。 因 为 0 没有 第 一 个 非 零 
位 ， 因 此 0 不 能 被 规格 化 。 

例 3.36 十 进 制 数 -328.4 的 科学 计数 法 规格 化 表示 是 -3.284X10*"，10 的 2 次 方 的 
作用 是 把 小 数 点 往 右 移动 2 位 。 类 似 地 ， 二 进 制 数 -10101.101 的 科学 计数 法 规格 化 形式 
是 -1.0101101X2*, 2 的 4 次 方 的 作用 是 把 二 进 制 小 数 点 往 右 移 动 4 位 。 口 

例 3.37 二 进 制 数 0.00101101 的 科学 计数 法 规格 化 表示 是 
1.01101X2-，2 的 -3 次 方 的 作用 是 把 二 进 制 小 数 点 往 左 移动 3 位 。 口 [| | |] 

一 般 来 说 ， 浮 点 数 可 以 是 正 数 或 负数 ， 它 的 指数 也 可 以 是 正 整数 ”和 一 一 一 一 
或 负 整 数 。 图 3-29 展示 了 存储 浮 点 数值 的 一 个 内 存单 元 。 单 元 分 为 3 | | igs 
个 字段 ， 第 一 个 字段 1 位 ， 用 于 存储 该 数 的 符号 ， 第 二 个 字段 存储 代 
表 规 格 化 二 进 制 数 的 指数 位 ， 第 三 个 字段 称 为 有 效 位 数 ， 存 储 代表 数 
值 大 小 的 位 。 iii 

任何 有 符号 整数 的 表示 方法 都 可 以 用 于 存储 指数 。 你 可 能 会 想到 图 3-29 浮 点 数 的 存储 


指数 


用 补 码 表示 ， 因 为 大 多 数 计 算 机 存储 有 符号 整数 都 用 它 。 但 是 实际 上 没有 用 补 码 ， 而 是 用 了 
有 偏差 的 表示 方法 ， 后 面 很 快 会 解释 这 个 原因 。 

— 5 位 单元 有 偏差 表示 的 例子 是 余 15 码 (Excess 15 )。 单 元 存储 数字 的 范围 十 进 制 
表示 为 -15 到 16， 二 进 制 表示 为 00000 到 11111。 把 十 进 制 转换 到 余 15 码 是 把 十 进 制 数值 
加 15， 然 后 按照 无 符号 数 方式 转换 为 二 进 制 。 从 余 15 码 转 换 为 十 进 制 是 把 它 按 照 无 符号 数 
写作 十 进 制 数 ， 然 后 减 去 15。 在 余 15 码 中 ， 第 一 位 表示 一 个 值 是 正 还 是 负 ， 不 过 与 补 码 表 
示 不 一 样 ，1 表示 正 值 ，0 表示 负 值 。 

例 3.38 把 十 进 制 $ 转 换 到 余 1$ 码 ，$ + 15 = 20, 
然后 按照 无 符号 数 方法 把 20 转换 为 二 进 制 ，20 (dec) = 
10100 (excess 15 )。 第 一 位 是 1 表示 是 一 个 正 值 。 口 ] 

例 3.39 把 00011 从 余 15 码 转 换 到 十 进 制 ， 把 00011 当 
作 无 符号 值 转换 ,00011 (bin) = 3 (dec)， 然 后 3 - 15 = -12， 
因此 00011 (excess 15 ) = -12 (dec), C 

图 3-30 展示 了 一 个 3 位 单元 以 余 3 码 表 示 和 以 补 码 表 
示 存 储 整数 的 比较 。 每 种 表示 法 存储 8 个 值 ， 余 3 码 的 表 
数 范 围 是 -3 到 4 (dec)， 而 补 码 的 是 -4 到 3 (dec), O 


3.5.3 ”隐藏 位 


假设 浮 点 数 以 第 一 个 非 零 位 直接 存储 为 小 数 点 左边 的 规格 化 形式 ， 那 么 就 不 需 精 确 地 存 
储 二 进 制 小 数 点 ， 因 为 它 总 是 在 同样 的 位 置 。 假 设 图 3-29 的 符号 位 为 1 表示 负 值 ， 为 0 表 
示 正 值 ， 指 数 是 3 位 ， 尾 数 是 4 位 ， 那 么 可 以 存储 尾数 为 4 位 的 数字 。 要 存储 十 进 制 值 ， 首 
先 把 它 转换 为 二 进 制 ， 写 成 规格 化 的 科学 计数 法 的 形式 ， 然 后 以 余 3 码 的 形式 存储 指数 ， 再 
存储 尾数 的 多 个 最 高 有 效 位 。 

例 3.40 存储 0.34， 把 它 转 换 到 二 进 制 0.34 (dec) = 0.010101110...， 这 个 位 序列 是 
无 穷尽 的 ， 因 此 只 存储 最 高 位 。 这 个 数 的 规格 化 科学 计数 法 值 是 1.0101110…X2” 了 ， 指 数 
是 -2。 从 图 3-30 可 以 看 到 它 的 余 3 码 表 示 是 001。 最 高 的 4 位 是 1010， 它 在 第 一 个 数字 的 
后 面 隐 含 了 小 数 点 。 这 个 数 是 正 数 ， 因 此 符号 位 是 0。 存储 这 个 值 的 位 模式 是 0 001 1010。 

来 看 一 看 这 个 近似 值 有 多 接近 ， 把 存储 值 转换 回 十 进 制 。 存 储 值 1.010X2™ (bin) = 
0.3125， 它 和 原始 十 进 制 值 相 差 0.0275 。 口 

令 人 遗憾 的 是 不 能 在 尾数 中 存储 更 多 的 高 位 数字 。 当 然 ， 与 实际 机 器 中 的 浮 点 数 格式 相 
比 ， 指 数 3 位 ， 尾 数 4 位 是 太 小 了 。 例 子 采 用 这 么 小 的 表示 是 为 了 说 明 起 来 简单 。 然 而 ， 即 
使 在 实际 的 机 絮 中 尾数 字段 大 得 多 ， 近 似 度 好 很 多 ,但 是 仍然 不 可 避免 近似 的 发 生 ， 因 为 内 
存单 元 是 有 限 的 。 

可 以 利用 当 数 字 用 规格 化 表示 时 二 进 制 小 数 点 左边 总 是 1 的 这 个 事实 。 因 为 1 总 是 在 那 
里 ， 所 以 可 以 简单 地 不 存储 它 ， 这 可 以 给 尾数 扩展 1 位 精确 度 的 空间 。 这 个 假定 在 二 进 制 小 
数 点 左边 而 又 不 显 式 存储 的 位 叫 作 隐藏 位 (hidden bit). 

例 3.41 采用 假定 在 尾数 中 有 隐藏 位 的 表示 方法 ，0.34 (dec) 存储 为 0 001 0101。 二 进 
制 小 数 点 右边 的 前 4 位 是 0101， 小 数 点 左边 的 1 位 是 假定 的 。 来 看 看 精确 度 的 改进 。 现 在 
的 存储 值 是 1.0101X2™ (bin) = 0.328 125， 它 与 原始 的 十 进 制 值 相 差 0.011 875， 没 有 隐藏 
位 的 差 是 0.0275， 因 此 使 用 隐藏 位 改进 了 近似 值 。 口 





图 3-30 3 位 单元 存储 的 有 符号 整数 
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当然 隐藏 位 是 假定 的 ， 不 要 忽略 它 。 当 在 一 个 程序 中 写 十 进 制 浮 点 数 时 ， 编 译 做 生成 代 
码 把 值 转换 为 二 进 制 ， 会 丢弃 假定 存在 的 隐藏 位 ， 尽 可 能 多 地 存储 二 进 制 小 数 点 右边 的 位 。 
如 果 程 序 把 两 个 存储 的 浮 点 数 相 乘 ， 那 么 计算 机 在 执行 乘法 运算 前 ， 会 抽取 尾数 位 并 插入 假 
设 的 隐藏 位 。 对 于 乘积 ， 会 除去 隐藏 位 后 才 进 行 存储 。 


3.5.4 ”特殊 值 


有 些 实际 值 需 要 特殊 看 待 ， 最 明显 的 是 0， 因 为 它 的 二 进 制 表示 中 没有 为 1 的 位 ， 因 此 
它 不 能 规格 化 表示 ， 必 须 为 它 设置 一 个 特殊 的 位 模式 。 标 准 的 做 法 是 把 指数 全 置 为 0， 尾 数 
也 全 置 为 0。 符号 位 呢 ? 最 常见 的 是 0 有 两 种 表示 : 一 个 正 0， 一 个 负 0。 如 果 指 数 3 位 ， 
尾数 4 位 ， 两 种 0 的 位 模式 是 

1 000 0000 (bin) = -0.0 (dec) 

0 000 0000 (bin) = +0.0 (dec) 

不 过 ，0 的 存储 还 有 其 他 解决 方案 。 如 果 +0.0 的 位 模式 没有 特殊 指定 ， 那 么 0 000 0000 
会 被 解读 成 有 隐藏 位 ， 看 作 1.0000X2” (bin) = 0.125， 如 果 这 个 值 没 有 被 保留 为 0， 那 么 
这 就 是 可 以 存储 的 最 小 正 值 。 如 果 这 个 位 模式 为 0 保留， 那么 可 存储 的 最 小 正 值 是 略 大 的 
0 000 0001 = 1.0001 X2° (bin) = 0.132 812 5。 除 了 符号 位 是 1， 数 值 最 小 负数 的 尾数 应 该 
是 一 样 。 具 有 最 小 非 0 尾数 的 数 应 该 是 

1 000 0001 (bin) = -0.1328125 (dec ) 

0 000 0001 (bin) = +0.1328125 (dec) 

可 以 存储 的 最 大 正 整 数 的 位 模式 应 该 具有 最 大 指数 和 最 大 尾数 ， 而 具有 最 大 数值 大 小 的 
负数 应 该 是 一 样 的 位 模式 ， 除 了 符号 位 为 1。 具有 最 大 数值 大 小 的 位 模式 和 它们 的 十 进 制 值 
应 该 是 

1 111 1111 (bin) = -31.0 (dec) 

0 111 1111 (bin) = +31.0 (dec) 

图 3-31 是 0 有 唯一 特殊 值 的 表示 方式 所 对 应 的 数 轴 。 和 整数 表示 一 样 ， 可 以 存储 多 大 的 
值 是 有 限制 的 。 如 有 果 9.5 乘 以 12.0, 两 者 310  -0.1328125 00 0.1328125 31.0 
RIA, (RRM ASCE 1140 jf +>. 2 
EERE oe oS ae 

然而 ， 和 整数 值 不 一 样 的 是 ， 实 数 轴 A 
有 下 溢 区 。 如 果 0.125 FEL 0.125， 两 者 都 
在 范围 内 ， 但 乘积 的 真 值 0.156 25 却 在 正 
下 溢 区 ， 可 以 存储 的 最 小 正 值 是 0.132 815. 图 3-31 0 有 唯一 特殊 值 的 实数 轴 

当 计 算 以 确切 的 精度 进行 时 ， 近 似 的 浮 点 数 的 数值 计算 结果 要 和 预期 保持 一 致 。 例 如 ， 假 
设 9.5 乘 以 12.0， 结 果 应 该 存储 什么 呢 ? 假设 把 最 大 值 31.0 作为 近似 结果 存储 。 再 假设 它 是 一 
个 更 长 计算 的 中 间 值 ， 然 后 要 计算 它 的 一 半 是 多 少 ， 将 得 到 15.5， 这 和 正确 的 值 相差 甚 远 。 

在 下 溢 区 有 同样 的 问题 。 如 果 把 0.0 作为 0.156 25 的 近似 值 存 储 ， 然 后 再 把 它 乘 以 
12.0， 就 会 得 到 0.0。 你 会 有 被 看 上 去 合理 的 值 误 导 的 风险 。 

由 上 洪 和 下 洲 引 起 的 这 些 问题 ， 通 过 引入 更 多 的 特殊 值 会 有 所 改善 。 5 0 的 表示 一 样 ， 
必须 用 一 些 特殊 的 位 模式 来 表示 这 些 特殊 值 ， 如 果 这 些 位 模式 不 用 来 表示 特殊 值 ， 就 可 以 用 
来 表示 数 轴 上 的 值 。 除 了 0 以 外 ， 有 3 个 常用 的 特殊 值 : 


e LAK 

o JE% 

e 非 规格 化 数 

无 穷 大 用 于 表示 汶 出 区 的 值 。 如 果 运 算 结 果 洲 出， 那么 就 存储 无 穷 大 的 位 模式 。 如 果 再 
对 这 个 位 模式 执行 运算 ， 结 果 就 是 预期 的 值 一 一 无 穷 。 例 如 ，3/ %= 二 0,，5+% 二 %， 而 无 
穷 大 的 平方 根 是 无 穷 大 。 除 以 0 会 得 到 无 穷 大 ， 例 如 ，3/ % =%, -4/% 二 -wm。 如 果实 数 
做 计算 得 到 无 穷 大 ， 那 么 就 可 以 知道 某 个 中 间 结 果 发 生 了 溢出 。 

如 果 一 个 值 不 是 一 个 数 ( 即 ， 非 数 )， 它 的 位 模式 称 为 NaN。 用 NaN 来 表示 非法 的 浮 点 
运算 ， 例 如 ， 取 负数 的 平方 根 得 到 NaN，0/0 也 得 到 NaN。 任 何 至 少 有 一 个 NaN 操作 数 的 
浮 点 运算 都 得 到 NaN， 例 如 ，7 + NaN = NaN. 

无 穷 大 和 NaN 的 位 模式 都 使 用 了 指数 的 最 大 正 值 ， 即 指数 字段 是 全 1。 无 穷 大 的 尾数 
为 全 1，NaN 的 尾数 可 以 是 任何 非 零 模式 。 把 这 些 位 模式 保留 给 无 穷 大 和 NaN 会 减少 可 以 
存储 的 值 的 范围 。 对 于 3 位 指数 和 4 位 尾数 来 说 ， 最 大 数值 的 位 模式 和 它们 的 十 进 制 值 是 

1 111 0000 (bin) 一- œ 

1 110 1111 (bin) = -15.5 (dec) 

01101111 (bin) = +15.5 (dec) 

0 111 0000 (bin) = + 

在 图 3-31 中 ， 上 溢出 区 的 无 穷 大 值 ， 没 有 对 应 的 下 海区 的 无 穷 小 值 。 不 过 非 规格 化 数 是 
特殊 的 什 ， 它 们 有 一 个 很 好 的 属性 ， 称 为 逐 级 下 溢 。 有 了 逐 级 王 溢 ， 最 小 正 值 和 0 之 间 的 差距 
减 小 了 很 多 。 主 要 思想 是 ， 选 取 那 些 指 数字 段 全 0 的 非 零 值 ， 把 它们 平均 分 布 在 下 溢 区 中 。 

因为 指数 字段 全 0 是 为 非 规格 化 数 保 留 的 ， 所 以 最 小 正规 格 化 数 是 0 001 000 = 1.000X 
2° (bin) = 0.25 (dec)。 如 果 指 数字 段 可 以 是 000， 那 么 最 小 正规 格 化 数 是 0.132 8125, 我 
们 现在 的 做 法 似乎 把 事情 弄 得 更 糟 了 。 但 是 ， 非 规格 化 数 分 布 在 原来 表示 方法 的 下 洲 区 间 
内 ， 实 际 上 是 减 小 了 下 海区 的 大 小 。 

当 指数 字段 全 是 0、 尾 数 至 少 包 含 一 个 1 时 ， 要 使 用 特殊 的 表示 规则 。 假 定 指数 是 3 
位 ， 尾 数 是 4 位 ， 

e 假定 二 进 制 小 数 点 左边 的 隐藏 位 为 0， 而 不 是 1。 

e 假定 指数 以 余 2 码 而 不 是 余 3 码 的 形式 存储 。 

Bj 3.42 对 于 3 位 指数 、4 位 尾数 的 表示 方法 来 说 ，0 000 0110 表示 什么 十 进 制 值 ? A 
为 指数 全 是 0， 尾 数 至 少 包含 一 个 1， 所 以 这 个 数 是 非 规格 化 数 ， 它 的 指数 是 000 ( 余 2 码 ) = 0 - 
2 = -2， 它 的 隐藏 位 是 0， 所 以 它 的 二 进 制 科学 计数 值 是 0.011027 。 因 为 这 是 非 规格 化 
数 的 特殊 情况 ， 所 以 指数 以 余 2 码 而 不 是 余 3 码 表示 。 将 这 个 二 进 制 值 转换 为 十 进 制 ， 得 到 
0.093 75. 口 

这 样 的 表示 会 让 下 洲 区 的 表示 变 得 更 好 。 计 算 具 有 最 小 数值 的 数 ， 它 是 非 规格 化 的 。 

1 000 0001 (bin) = -0.015625 (dec) 

1 000 0000 (bin) = -0.0 

0 000 0000 (bin) = +0.0 

0 000 0001 (bin) = -0.015625 (dec) 

如 果 没 有 非 规格 化 数 ， 最 小 正 数 是 0.132 812 S， 因 此 实际 上 下 溢 区 变 小 了 很 多 。 

图 3-32 展示 了 具有 所 有 特殊 值 的 3 位 指数 和 4 位 尾数 表示 法 的 一 些 重要 值 。 这 些 值 按 
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照 数字 从 小 到 大 的 顺序 排列 。 图 3-32 表明 为 什么 要 用 余 码 来 表示 浮 点 数 的 指数 。 忽 略 符号 
位 ， 只 考虑 从 0.0 到 + % 的 正 数 。 可 以 看 到 ， 如 果 把 最 右边 的 7 位 看 作 一 个 简单 的 无 符号 整 
数 ， 那 么 从 表示 0 的 000 0000 到 表示 wm 的 111 0000， 相 邻 的 值 都 是 加 1。 如 果 对 两 个 浮 点 数 
进行 比较 ， 比 如 这 样 一 条 C++ 语句 

it CX S M2 

那么 计算 机 不 需要 提取 指数 字段 或 者 插入 隐藏 位 ， 只 需要 把 最 右边 7 位 当 作 整 数 ， 进 行 
比较 ， 就 能 判断 哪个 浮 点 数 有 更 大 的 数值 。 整 数 运算 的 电路 要 比 浮 点 数 的 快 很 多 ， 因 此 用 余 
码 表示 指数 实际 上 提高 了 性 能 。 


11101111 
11101110 


-0.03125 
-0.015625 


0 000 0001 -0.015625 
0 000 0010 -0.03125 





图 3-32 3 位 指数 和 4 位 尾数 的 浮 点 数值 
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对 于 负数 ， 也 有 同样 的 模式 。 可 以 把 最 右 的 7 位 看 作 无 符号 整数 ， 用 以 比较 负数 的 数值 
大 小 。 如 果 指 数 用 补 码 表示 ， 浮 点 数 就 不 会 有 这 样 的 属性 。 

如 果 x 值 计 算 为 -0.0，y 值 计 算 为 +0.0， 那 么 程序 员 会 预期 表达 式 ( x<y) 为 false。 
对 于 实数 ， 正 0 和 负 0 没 有 区 别 。 在 这 种 特定 情况 下 ， 即 使 位 模式 表示 x 是 负数 y 是 正 数 ， 
计算 机 编程 也 一 定 要 返回 false. 


3.5.5 IEEE 754 浮 点 数 标准 


电气 电子 工程 师 学 会 (IEEE) 是 一 个 由 会 员 支 持 的 专业 协会 ， 为 各 种 工程 领域 提供 服 
Z, 计算 机 工程 就 是 其 中 之 一 。 协 会 内 有 各 种 小 组 起 草 工业 标准 。 在 IEEE 提出 它 的 浮 点 数 
标准 之 前 ， 每 个 计算 机 厂商 都 设计 它们 自己 的 浮 点 数值 表示 法 ， 互 不 相同 。 在 网 络 普 及 前 的 
早期 ,计算 机 之 间 的 数据 共享 很 少 ， 因 此 这 种 情况 尚 可 容忍 。 

即便 没有 大 量 的 数据 共享 需求 ， 标 准 的 缺失 也 阻碍 了 数字 计算 的 研究 和 发 展 。 在 两 台 不 
同 的 计算 机 上 运行 两 个 一 样 的 程序 ， 同 样 的 输入 可 能 产生 不 同 的 结果 ， 原 因 是 两 台 计 算 机 采 
用 了 不 同 的 近似 值 表示 法 。 

1985 年 IEEE 设立 了 一 个 委员 会 来 起 草 浮 点 数 标 准 。 最 终 产 生 了 两 个 标准 : 854 更 适用 
于 手持 计算 器 ， 而 754 广泛 应 用 于 计算 机 。 实 际 上 ， 现 在 每 个 计算 机 厂商 的 计算 机 中 的 浮 点 
数 都 遵循 IEEE 754 标准 。 

在 本 节 前 面 讲述 的 浮 点 数 表示 法 中 ， 除 了 指数 字段 和 有 效 位 的 数位 不 同 之 外 ， 其 余 的 都 
和 IEEE 754 是 一 样 的 。 图 3-33 展示 了 这 个 标准 的 两 种 格式 : 单 精度 格式 的 指数 字段 是 8 位 
单元 ， 采 用 余 127 码 表 示 〈 除 了 非 规格 化 数 ， 它 们 用 的 余 126 码 )， 尾 数 是 23 位 ; 双 精 度 格 
式 的 指数 字段 是 11 位 单元 ， 采 用 余 1023 码 表 示 《〈 除 了 非 规格 化 数 ， 它 们 用 的 余 1022 码 )， 
尾数 是 52 位 。 


位 1 8 23 位 1 11 52 
a) 单 精 度 b) 双 精 度 


图 3-33 IEEE 754 浮 点 数 标准 


有 下 列 单 精 度 格 式 的 位 值 ， 正 无 穷 大 是 
0 1111 1111 000 0000 0000 0000 0000 0000 

写成 4 位 一 组 的 全 32 位 模式 为 
0111 1111 1000 0000 0000 0000 0000 0000 

它 的 十 六 进 制 简化 表示 为 7F80 0000 (hex)。 最 大 的 正 值 为 
0 1111 1110 111 1111 1111 1111 1111 1111 

其 值 近似 是 2 或 108， 它 的 十 六 进 制 表示 是 7F7F FFFF (hex)。 最 小 的 规格 化 正 数 是 
0 0000 0001 000 0000 0000 0000 0000 0000 

它 的 十 六 进 制 表示 是 0080 0000 (hex)。 最 小 的 非 规格 化 正 数 是 
0 0000 0000 000 0000 0000 0000 0000 0001 

它 的 十 六 进 制 表示 是 0000 0001 (hex)， 近 似 值 为 10. 


William V. Kahan 





1933 +, William V. Kahan 生 于 加 拿 大 。 他 曾 就 读 于 多 伦 多 大 学 ，1958 年 获得 数学 


128 
129 
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博士 学 位 。 

1976 年 ，Intel 计划 为 它 的 微 处 理 器 产品 线 构造 一 个 浮 点 协 处 理 器 。John Palmer 负 
责 该 项 目 ， 他 说 服 Inte 需要 一 个 数学 标准 ， 这 样 公司 生产 
的 不 同 芯 片 对 于 相同 的 浮 点 输入 就 能 得 到 相同 的 输出 。 在 
Stanford 大 学 时 ，Palmer 听 说 过 Kahan 分 析 了 一 些 当 时 流行 
的 计算 机 的 浮 点 值 表示 。 他 民用 Kahan 作为 咨询 专家 ， 建 立 
浮 点 数 表示 法 的 细节 。 

在 那 之 后 ，IEEE 成 立 了 一 个 委员 会 来 开发 业界 的 浮 点 
数 标准 。Kahan 是 该 委员 会 的 成 员 ， 虽然 刚 开始 有 一 些 争 议 ， 

但 是 他 在 Intel 的 工作 还 是 成 为 了 IEEE 754 标准 的 基础 。 当 

Bt, Digital Equipment Corporation (DEC) 在 它 的 VAX 系 

列 计算 机 上 采用 了 一 种 广 受 重视 的 浮 点 数 表示 法 。 在 刚 开始 

与 Palmer 接触 时 ，Kahan 甚至 建议 Intel 就 采用 该 方法 。 但 是 VAX 的 表示 法 没有 逐 级 下 
溢 的 非 规格 化 数 。 在 委员 会 的 讨论 中 ， 因 为 认为 这 种 表示 法 的 所 有 实现 执行 起 来 都 很 慢 ， 
所 以 这 个 特性 成 为 一 个 很 大 的 问题 。 这 场 关 于 逐 级 下 溢 的 论战 持续 多 年 ，DEC 声称 具有 
逐 级 下 溢 特 性 的 计算 性 能 都 不 可 能 超过 VAX。 最 后 ， 加 利 福 尼 亚 大 学 伯克利 分 校 的 Dave 
Patterson 的 一 个 研究 生 ，George Taylor， 构 建 了 一 个 Kahan 的 浮 点 数 标准 的 工作 原型 电 
路 板 ， 可 以 插入 VAX 机 器 而 不 会 降低 机 器 的 速度 。 

本 章 略 去 了 很 多 有 关 IEEE 756 的 细节 ， 包 括 保 护 数字 、 异 常 和 标志 等 方面 的 规定 。 
Kahan 致力 于 “让 数值 计算 的 世界 更 安全 ”。 实 际 上 ， 所 有 硬件 都 遵循 该 标准 ， 只 是 有 些 
软件 系统 没有 很 好 地 利用 异常 和 标志 。 当 发 生 这 种 情况 时 ,Kahan arhinki 问题 。 
Sun Microsystems 在 推广 Java 语言 时 用 到 这 样 一 名 口号 “ 写 一 次 ， 随 处 运行 ， 就 曾经 被 
Kahan 在 名 为 “How Java’s Floating-Point Hurts Everyone Everywhere ”的 论文 中 批评 过 。 
当 Matlab 软件 最 新 发 布 的 版 本 没有 像 较 早 的 版 本 那样 遵循 IEEE 754 标准 时 ，Kahan 的 论 
文 题目 就 是 “Matlab’s Loss Is Nobody’s Gain”。 

1989 年 ，William Kahan 因为 他 在 数值 分 析 方 面 的 基础 性 贡献 获得 了 A . M. Turing 奖 。 在 
本 书 书写 之 时 ， 他 是 加 利 福 尼 亚 大 学 伯克利 分 校 数学 系 和 电器 工程 和 计算 机 科学 系 的 教授 。 


例 3.43 -47.25 的 单 精度 浮 点 数 的 十 六 进 制 表示 是 什么 ?整数 47 (dec) = 101111(bin)， 
小 数 0.25 (dec) = 0.01 (bin)， 因 此 47.25 (dec) = 1.0111101X25。 这 个 数 是 负数 ， 因 此 第 
一 位 是 1， 指数 5 通过 5+127 = 132 (dec) = 1000 0100 ( 余 127 ) 转换 为 余 127 码 ， 尾 数 存 
储 二 进 制 小 数 点 右边 的 0111101， 因 此 位 模式 是 

1 1000 0100 011 1101 0000 0000 0000 0000 
十 六 进 制 表 示 为 C23D 0000 (hex). 口 

例 3.44 十 六 进 制 表示 为 3CC8 0000 的 二 进 制 科学 表示 法 是 什么 ? 它 的 位 模式 为 
0 0111 1001 100 1000 0000 0000 0000 0000， 符 号 位 是 0， 因 此 这 个 数 是 正 数 ， 指 数 是 
0111 1001 (excess 127) = 121 (unsigned) = 121-127 = -6 (dec)， 尾 数 的 小 数 点 右边 是 
1001 ， 隐 藏 位 为 1， 因此 这 个 数 是 1.1001X2”。 口 

例 3.45 十 六 进 制 表示 为 0050 0000 的 二 进 制 科学 表示 法 是 什么 ? 它 的 位 模式 是 
0 0000 0000 101 0000 0000 0000 0000 0000， 符 号 位 是 0， 因 此 它 是 正 数 ， 指 数字 段 全 是 0， 
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因此 它 是 非 规格 化 数 ， 指 数 0000 0000 (excess 126 ) = 0 (unsigned) = 0-126 = -126 (dec), 
隐藏 位 是 0 而 不 是 1， 因 此 这 个 数 是 0.101 X 27°, 口 


3.6 ” 跨 层 的 表示 方法 


C++ 是 一 种 HOL6 层 语 言 ， 当 程序 员 在 C++ 中 声明 变量 时 ， 必 须 指定 变量 值 的 类 型 。 
而 在 ISA3 层 ， 变 量 是 二 进 制 的 。 
假设 在 一 个 C++ 程序 中 声明 了 
tie tae oe 
char Chl. el 
并 在 一 台 7 位 计算 机 上 运行 这 个 程序 。 在 ISA3 J, int 类 型 的 值 以 补 码 二 进 制 表示 法 存储 。 
如 果 i Al j 的 值 分 别 是 8 和 -2， 程 序 包 含 语 句 
1 J 130 
那么 在 ISA3 层 对 这 个 表达 式 求 值 是 这 样 的 : 


000 1000 
ADD 111 1110 


N=0 0000110 

=H 

=p 

C=] 

在 ISA3 JZ, char 类 型 的 值 以 ASCU 或 其 他 字符 编码 的 形式 存储 。 如 果 ch1 的 值 是 -， 
ch2 的 值 是 2， 那 么 这 些 值 在 ISA3 层 被 存储 为 

010 1101 011 0010 
这 个 位 模式 当然 和 整数 j 的 值 不 一 样 ，j 的 值 是 111 1110。 

在 C++ 中 ,在 HOL6 层 ， 每 个 字符 在 数 轴 上 都 有 一 个 序数 值 位 置 。 在 ISA3 层 ， 机 器 
层 ， 这 个 序数 值 就 是 作为 无 符号 整数 来 解释 的 字符 编码 的 二 进 制 值 。 因 为 不 同 的 计算 机 可 以 
选择 使 用 不 同 的 二 进 制 符号 编码 ， 所 以 它们 的 序数 值 可 能 会 不 同 。 

例 3.46 根据 ASCII 表 ，D 用 100 0100 代表， 而 100 0100 (bin) = 68 (dec)。 在 一 台 
使 用 ASCII 码 的 计算 机 上 ，p 的 序数 值 就 是 68。 口 

例 3.47 要 在 你 的 计算 机 上 振 铃 ， 可 以 执行 如 下 产生 振 铃 的 语句 

int j = 7; 

char ch = j; 

cout << ch; O 


在 HOL6 层 ， 高 级 语言 的 一 个 典型 语句 是 
cout << "Tom"; 
字符 串 常 量 Tom 被 传送 到 输出 设备 。 这 条 语句 在 ISA3 层 并 不 这 么 简单 。 在 机 器 语言 中 ， 你 
没 法 “ 写 出 Tom”， 而 是 必须 把 位 序列 
101 0100 
110 1111 
110 1101 
发 送 到 输出 设备 。 131 
为 什么 我 们 要 处 理 位 而 不 是 我 们 习惯 的 英文 字母 和 十 进 制 数字 呢 ? 因为 计算 机 是 电子 的 。 
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最 便宜 最 可 靠 的 制造 计算 机 电子 部 件 的 方法 是 把 它们 做 成 二 进 制 的 ， 因 此 我 们 只 能 用 二 进 制 机 
器 来 处 理 信 息 。ISA3 层 的 问题 是 我 们 要 处 理 的 信息 是 十 进 制 数 字 和 英文 字母 的 形式 ， 而 机 咒 
语言 是 以 1 和 0 的 形式 表示 信息 ， 因 此 需要 进行 编码 ， 例 如 补 码 二 进 制 表 示 法 和 ASCII。 

要 处 理 的 信息 形式 和 表示 信息 的 语言 之 间 的 不 匹配 并 不 只 是 在 ISA3 层 有 ， 这 也 是 所 有 
较 高 层次 要 考虑 的 重要 问题 。 

通过 旅行 推销 员 问 题 可 以 说 明 HOL6 层 的 这 种 情况 。 一 个 推销 员 负 责 8 个 不 同城 市 的 
业务 ， 他 乘坐 航空 公司 航班 穿梭 在 这 些 城 市 之 间 ， 这 8 个 城市 之 间 有 14 条 航空 线路 。 要 处 
理 的 信息 形式 是 航空 公司 提供 的 地 图 ， 地 图 展示 了 连接 推销 员 负 责 范 围 内 城市 之 间 的 所 有 航 
线 。 地 图 如 图 3-34 所 示 ， 它 也 标 出 了 每 条 航线 航班 的 价格 。 


萨克拉门托 
40 


旧金山 


70 





图 3-34 旅行 推销 员 问 题 的 地 图 


推销 员 必 须 从 洛杉矶 出 发 ,访问 他 职责 范围 内 的 每 个 城市 ， 然 后 返回 洛杉矶 ， 他 当然 想 
把 他 的 行程 计划 为 花费 最 少 的 。 

确定 最 佳 行程 表 听 起 来 像 是 计算 机 的 完美 工作 。 推 销 员 把 地 图 给 程序 员 ， 程 序 员 知道 怎 
样 用 HOL6 层 语 言 (Pin, C+) 来 说 话 。 

但 是 现在 程序 员 要 面 对 这 个 计算 机 科学 的 根本 问题 。 地 图 和 HOL6 层 语言 这 两 种 数据 形 
式 不 匹配 ，C++ 不 认识 地 图 ， 它 只 能 认识 诸如 实数 、 整 数 和 数组 之 类 的 东西 。 

程序 员 必 须 决定 怎样 用 C++ 能 够 处 理 的 形式 来 表达 数据 。 例 如 ， 他 可 以 用 如 图 3-35 所 
示 的 二 维 实数 数组 来 表示 地 图 。 在 这 个 方案 中 ， 顶 行 和 左 列 的 整数 代表 推销 员 所 负责 范围 内 
的 城市 ， 表 中 每 个 实数 表示 从 行 索 引 代表 的 城市 到 列 索引 代表 的 城市 的 美元 价格 。 如 果 这 个 


二 维 数组 叫 cost, AA 
cost [0][5] = 65 

表示 从 城市 0 (洛杉矶 ) 飞 到 城市 5 (萨克拉门托 ) 的 费用 是 65 美元 。 
cost [1][7] = 1e30 


表示 城市 1 (圣地 亚 哥 ) 和 城市 7〈 拉 斯 维 加 斯 ) 之 间 没 有 航线 。 
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City Numbers 





0 洛杉矶 4 旧金山 

l 圣地 亚 哥 5 萨克拉门托 
2 Fe Hal RR 6 里 诺 

3 圣 芭 芭 拉 7 拉 斯 维 加 斯 


图 3-35 图 3-34 所 示 航 班 图 的 一 种 数组 表示 


原始 数据 转换 为 C++ 可 以 处 理 的 表示 后 ，HOL6 层 程序 员 可 以 继续 他 的 算法 设计 ， 并 最 
终 解决 这 个 问题 。 但 是 第 一 步 必然 用 这 种 语言 能 够 处 理 的 形式 来 表示 这 些 数 据 。 

ISA3 层 的 问题 是 怎样 用 机 天 语言 来 表示 数字 和 字母 ，HOL6 层 的 问题 是 怎样 用 C++ 的 
整数 、 实 数 和 数组 来 表示 一 个 有 城市 、 线 路 和 航班 费用 的 地 图 。 在 这 两 个 层次 上 ， 都 有 最 根 
本 的 数据 表示 问题 。 


3.6.1 另 一 种 表示 


言 息 表示 问题 具有 挑战 性 的 一 面 是 通常 会 有 多 种 不 同 的 方法 来 表示 数据 。 选 择 哪 种 表示 
取决 于 要 怎样 处 理 数据 。 

这 里 有 一 个 在 ISA3 层 表 示 正 整数 的 男 一 种 方法 。 尽 管 本 章 用 无 符号 二 进 制 来 表示 正 
数 ， 但 这 并 不 是 唯一 的 可 能 ， 正 整数 也 能 以 二 进 制 编码 的 十 进 制 数 ( Binary Coded Decimal, 
BCD) 形式 来 存储 。 

在 BCD 中 ， 每 个 十 进 制 的 位 刚好 需要 4 位 。 十 进 制 数 142 会 以 二 进 制 0001 0100 0010 
的 形式 存储 。 因 为 只 有 10 个 十 进 制 数 字 ， 因 此 4 位 的 BCD 组 是 0000、0001、0010、0011、 
0100、0101、0110、0111、1000 #11001, 从 1010 到 1111 的 位 模式 未 被 使 用 。 

如 果 数 据 更 多 的 是 在 计算 机 内 进行 算术 运算 而 不 是 IO 操作 ， 通 常会 选择 无 符号 二 进 
制 ; 当 数据 是 金融 业务 并 有 很 多 IO 操作 时 ， 通 常 选用 BCD。BCD 更 容易 转换 为 十 进 制 用 
于 打印 报表 ， 然 而 BCD 算术 运算 电路 通常 比 无 符号 二 进 制 算术 运算 电路 慢 。 

推销 员 问 题 中 也 有 类 似 的 选择 。 例 如 ， 航 空 公司 没有 在 所 有 可 能 的 城市 之 间 开 通航 线 ， 
尤其 是 小 城市 。 要 从 标 桐 录 到 里 诺 ， 必 须 首先 从 棕榈 果 飞 到 洛杉矶 ， 然 后 从 洛杉矶 再 到 里 
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。 在 图 3-35 中 ， 尽 管 只 有 14 条 航线 ， 但 是 cost 有 64 个 元 素 ， 大 多 数 元 素 是 leg30， 有 
nt Mt ey 
例如 ， 这 两 项 


cost[0][5] = 65 
cost[51[0] = 65 


代表 洛杉矶 和 萨克拉门托 之 间 只 有 一 条 航线 ， 假 设 两 个 方向 的 航班 费用 是 相等 的 ， 那 么 实际 
上 只 需要 一 个 项 ， 另 一 项 是 多 余 的 。 
因此 程序 员 可 以 决定 采用 图 3-36 所 示 的 方式 来 表示 地 图 。 在 HOL6 层 语言 中 ， 线 路 可 
以 实现 为 一 个 数组 route， 数 组 中 的 每 个 记录 包含 3 个 字段 : from, to 和 cost, HA 


HRS | 出 发 地 | 目的 地 | 开销 
o j | 


route[4].from = 0 
route[4].to = 5 
route[4].cost = 65 





表示 洛杉矶 和 萨克拉门托 之 间 的 飞行 花费 是 65 美元 。 

用 这 种 方式 表示 地 图 ， 不 会 为 不 存在 的 航线 浪 
费 存 储 空 间 。 如 果 城 市 9 和 城市 11 之 间 没 有 航线 ， 
那么 就 不 用 存储 它们 。 

在 HOL6 层 ， 地 图 还 有 其 他 表示 方式 , 与 在 
ISA3 层 无 符号 整数 有 其 他 表示 方式 一 样 。 在 任何 
层 ， 都 可 能 会 有 多 种 表示 数据 的 方法 ， 任 何 一 种 方 
法 都 能 得 到 正确 的 结果 。 

确定 哪 一 种 表示 最 好 通常 是 很 困难 的 。 实 际 
上 ， 通 常 要 定义 什么 是 “最 好 的 ”都 很 困难 。 如 果 
你 的 计算 机 有 大 内 存 ， 那 对 你 来 说 ， 最 好 的 表示 可 
能 是 一 种 有 点 儿 浪费 存储 的 方式 ， 因 为 有 足够 的 空 
间 。 另 一 方面 ， 如 果 内 存 不 足 ， 最 好 的 表示 就 是 少 ” 图 336 E 3.34 所 不 航班 图 的 为 一 种 表 不 
用 点 儿 存储 空间 ， 尽 管用 这 种 方式 处 理 数据 的 算法 会 很 慢 。 这 种 空间 / 时 间 的 折 中 适用 于 计 
算 机 系统 的 各 个 抽象 层次 。 与 所 有 创造 性 努力 会 遇 到 的 一 样 ， 这 种 选择 并 不 总 是 很 明确 的 。 


3.6.2 ”模型 


模型 是 某 些 物理 系统 的 简化 表示 。 每 个 科学 领域 的 工作 人 员 ， 包 括 计算 机 科学 ， 构 建 模 
型 并 人 研究 它们 的 性 质 ， 比 如 天 文学 家 构建 和 研究 的 一 些 太 阳 系 模型 。 

大 约 公元 前 350 年 ,希腊 的 亚 里 士 多 德 提 出 了 一 个 模型 ， 在 这 个 模型 中 ， 地 球 位 于 宇宙 
的 中 心 ， 环 绕 地 球 的 是 55 个 天 球 。 太 阳 、 月 亮 、 行 星 和 恒星 每 个 都 在 一 个 天 球 上 环绕 天 空 。 

这 个 模型 和 现实 相符 的 程度 如 何 呢 ? 它 能 成 功 地 解释 天 空 的 形状 像 球 的 顶部 一 样 ， 也 能 
解释 行星 大 概 的 运行 。 千 百年 来 ， 亚 里 士 多 德 的 模型 被 认为 是 准确 的 。 

1543 年 ， 波 兰 天 文学 家 哥 白 尼 出 版 了 《De Revolutionibus 》( 天 体 运 行 论 )， 在 这 本 书 中 ， 
他 建立 了 以 太阳 为 中 心 的 太阳 系 模型 ， 行 星 围 绕 太 阳 做 圆周 运转 。 这 个 模型 比 地 心 模型 更 接 
近 实 体系 统 。 

16 世纪 后 期 ， 丹麦 天 文学 家 Tycho Brahe (BA + 布 拉 赫 ) 进行 了 一 系列 精确 的 天 文 观察 ， 
这 些 观察 与 哥 白 尼 的 模型 有 一 定 的 差异 。 然 后 ，1609 年 ，Johannes Kepler (约翰 内 斯 * FEH ) 


设想 了 一 个 模型 ， 在 这 个 模型 中 ， 地 球 和 所 有 行星 围绕 太阳 运行 ， 但 轨道 不 是 圆 形 而 是 扁平 
的 圆 形 〈 即 椭圆 形 ) 。 这 个 模型 成 功 地 详细 解释 了 Tycho Brahe 观察 到 的 行星 的 复杂 运行 。 

每 个 模型 都 是 太阳 系 的 一 个 简化 表示 。 没 有 一 个 模型 能 够 完全 精确 地 描述 真实 的 物理 世 
界 。 现 在 我 们 知道 ， 根 据 爱 因 斯 坦 的 相对 论 ， 甚 至 Kepler 的 模型 也 是 一 个 近似 模型 。 没 有 
模型 是 完美 的 ， 每 个 模型 都 是 现实 世界 的 一 个 近似 。 

当 信息 在 计算 机 存储 器 中 表示 时 ， 这 个 表示 也 仅仅 是 一 个 模型 。 如 同 太 阳 系 的 每 个 模型 
描述 真实 系统 的 某 个 方面 比 其 他 方面 更 加 精确 一 样 ， 一 种 表示 方法 描述 信息 的 某 个 性 质 比 其 
他 性 质 更 精确 。 

例如 ， 正 整数 的 一 个 性 质 是 有 无 穷 大 的 数 。 不 管 你 写 一 个 多 大 的 整数 ， 别 人 总 能 写 出 更 
大 的 数 。 计 算 机 的 无 符号 二 进 制 表 示 不 能 很 精确 地 描述 这 个 性 质 ， 因 为 内 存 中 存储 整数 的 空 
间 大 小 是 有 限制 的 。 

我 们 知道 V2 = 1.4142136... 是 无 限 不 循环 的 。 存 储 实数 的 表示 方法 是 一 个 模型 ， 对 于 像 
2 的 平方 根 这 样 的 数 ， 它 只 能 存储 近似 数 ， 它 不 能 准确 地 表示 2 的 平方 根 。 

在 任何 层次 解决 问题 都 涉及 构建 一 个 不 完美 的 模型 并 研究 它 的 性 质 。HOL6 层 的 推销 员 
问题 是 确定 最 少 花 费 的 行程 ， 用 航线 地 图 把 他 的 花费 模型 化 。 这 个 模型 并 不 包括 一 些 因 素 ， 
比如 一 些 城市 的 某 些 酒店 可 能 在 周末 比 工 作 日 价格 更 贵 。 如 果 采 用 一 个 更 接近 现实 花费 的 模 
型 可 能 会 改变 最 佳 行程 。 

前 面 的 例子 说 明 计算 机 在 任何 时 候 解决 问题 ， 由 于 模型 的 限制 ， 总 会 涉及 近似 。 近 似 可 
能 由 于 表示 方法 的 限制 而 导致 产生 的 ， 例 如 在 存储 2 的 平方 根 值 时 实数 的 精度 是 有 限 的 ， 或 
者 由 于 对 问题 的 简化 导致 产生 的 ， 例 如 没有 把 不 同 的 酒店 价格 计算 在 内 。 

计算 机 能 模型 化 各 种 实体 系统 一 一 库存 清单 、 国 民 经 济 、 账 务 系统 和 生物 种 群 系统 ， 这 
里 仅 举 几 个 例子 。 在 计算 机 科学 中 ， 要 模型 化 的 通常 是 计算 机 本 身 。 

实际 上 ,计算 机 只 有 的 实体 部 分 是 在 LGI1 层 。 从 本 质 上 说 ,计算 机 只 是 一 个 复杂 的 、 
有 组 织 的 大 量 电 路 和 电子 信和 号。 在 ISA3 层 ， 高 电 平 信号 被 模型 化 为 1， 低 电 平 信号 被 模型 
化 为 0。ISA3 层 的 程序 员 在 使 用 模型 时 ， 不 需要 知道 电子 电路 和 信号 。 记 住 在 ISA3 层 ， 单 
词 Tom 用 1 和 0 表示 为 

101 0100 

110 1111 

110 1101 

HOL6 层 的 程序 员 在 使 用 模型 时 ， 不 需要 知道 位 。 实 际 上 ， 在 任何 层 ， 对 计算 机 编程 只 
需 有 那个 层 的 计算 机 模型 知识 即 可 。 

HOL6 层 的 程序 员 可 以 把 计算 机 模型 化 为 C++ 机器， 这 个 模型 接受 C++ 程序 并 用 它 来 
处 理 数 据 。 当 程序 员 指 示 机 需 


cout << "Tom"; 


他 不 需要 考虑 计算 机 在 ISA3 层 怎样 被 模型 化 为 二 进 制 机 器 。 类 似 地 ， 当 ISAS 层 程序 员 写 
位 序列 时 ， 他 无 须 考虑 在 LG1 层 计 算 机 怎样 被 模型 化 为 电路 的 组 合 。 

这 种 逐 级 为 计算 机 系统 建 模 的 方法 并 不 是 计算 机 科学 独 有 的 。 考 虑 一 个 有 6 个 分 公司 分 
布 全 国 的 大 公司 ， 公 司 总 裁 的 模型 是 6 个 分 公司 ， 每 个 分 公司 有 一 个 副 总 裁 向 他 汇报 ， 他 通 
过 看 每 个 分 公司 的 业绩 来 看 全 公司 的 业绩 。 当 要 求 产 品 部 门 增加 利润 时 ， 他 无 须 考虑 产品 部 
门 副 总 裁 的 模型 。 
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当 副 总 裁 给 产品 部 门 的 每 个 小 部 门 经 理 下 达 命令 时 ， 他 无 须 考虑 小 部 门 经 理 的 模型 。 让 
总 裁 杀 目 处 理 小 部 门 层 的 事务 几乎 是 不 可 能 的 ， 整 个 公司 有 太 多 小 部 门 层 的 细节 ， 不 可 能 由 
一 个 人 去 管理 。 

App7 层 的 计算 机 用 户 就 像 总 裁 ， 他 给 HOL6 层 的 程序 员 写 的 程序 发 出 诸如 “计算 所 有 
大 二 学 生 的 平均 分 ”的 指令 ， 他 无 须 考虑 HOL6 层 模 型 怎样 发 布 指令 。 最 终 ， 这 条 App7 层 
指令 逐 层 癌 下 传送 到 LG 层 。 最 终结 果 是 App7 层 的 用 户 能 够 用 非常 简化 的 计算 机 模型 控制 
大 量 的 电子 电路 和 信号 。 


总 结 


ws SF] 


二 进 制 数 只 可 能 是 两 个 数值 之 一 。 在 机 器 层 上 ， 计 算 机 以 二 进 制 形式 存储 信息 。 位 是 
二 进 制 数字 ， 不 是 0 就 是 1。 非 负 整 数 使 用 无 符号 二 进 制 表示 。 最 右 位 是 1 的 位 置 ， 它 左边 
的 一 位 是 2 的 位 置 ， 再 左边 一 位 是 4 的 位 置 ， 以 此 类 推 ， 每 左边 一 位 的 位 置 值 都 是 前 一 位 位 
置 值 的 两 倍 。 有 符号 整数 采用 补 码 表示 ， 其 中 第 一 位 是 符号 位 ， 剩 余 的 位 决定 该 数 的 数值 大 
小 。 对 于 正 数 来 说 ， 补 码 表示 与 无 符号 表示 相同 ; 而 对 于 负数 来 说 ， 它 的 补 码 可 以 通过 对 应 
正 数 的 反 码 加 1 得 到 。 

每 个 二 进 制 整数 ， 无 论 有 符号 还 是 无 符号 ， 都 有 表 数 范围 ， 这 是 由 内 存单 元 的 位 数 决 定 
的 。 单 元 的 位 数 越 小 ， 表 数 范 围 就 越 有 限 。 进 位 位 C 用 来 标识 无 符号 整数 是 否 超出 表 数 范 
围 ， 而 溢出 位 V 用 来 标识 补 码 表 示 的 数 是 否 超出 表 数 范围 。 二 进 制 整数 的 运算 包括 ADD. 
AND, OR 和 NOT。ASL 表示 算术 左 移 ， 实 际 上 是 对 一 个 二 进 制 值 乘 以 2 ; 而 ASR 表示 算术 
右 移 ， 是 对 一 个 二 进 制 数 除 以 2。 

十 六 进 制 数 系统 ， 基 数 为 16， 提 供 了 一 种 简洁 的 表示 位 模式 的 方法 。 十 六 进 制 的 16 个 
数字 是 0、1、2、3、4、5、6、7、8、9、A、B、C、D、E 和 了 F。 一 个 十 六 进 制 数字 表示 4 
位 。 美 国信 息 交 换 标准 代码 ， 简 称 ASCII， 是 一 种 存储 字符 的 稼 见 编码 方式 。 它 是 一 种 7 位 
编码 ， 可 以 表示 128 个 字符 ， 包 括 英 语 字母 表 的 大 小 写字 母 、 十 进 制 数 字 、 标 点 符号 和 不 可 
打印 的 控制 字符 。 

浮 点 数 的 存储 单元 包括 3 个 字段 : 1 位 的 符号 字段 、 指 数字 段 和 尾数 字段 。 除 了 特殊 数 
值 外 ， 数 字 以 二 进 制 科学 计数 法 方式 存储 ， 二 进 制 小 数 点 左边 的 隐藏 位 假定 为 1。 指数 以 余 
码 方 式 存 储 。4 个 特殊 值 是 零 、 无 穷 大 、NaN 和 非 规格 化 数 。IEEE 754 标准 将 指数 和 尾数 
字段 的 位 数 定义 为 单 精度 8 位 和 23 位 ， 双 精度 11 和 52 位。 

各 个 抽象 层次 的 基本 问题 是 待 处 理 信 息 的 形式 与 表达 它 的 语言 之 间 的 不 匹配 。 机 咒语 言 
书写 的 程序 处 理 位 ， 高 级 语言 书写 的 程序 处 理 数字 和 记录 这 样 的 对 象 。 无 论 程序 写 在 哪个 层 
次 上 ， 信 息 必 须 装 进 某 种 语言 能 够 识别 的 形式 中 。 将 信息 和 语言 进行 匹配 是 所 有 抽象 层次 上 
的 基本 问题 ， 是 解决 问题 的 建 模 过 程 中 近似 产生 的 根源 。 


练习 

3.1% 

*1. 数 出 下 列 数 字 后 面 的 10 个 数 (a) 八进制 从 267 开始 ,(b) 三 进 制 从 2102 开 始 ,(c) 二 进 制 从 
10101 开始 ，(d) 五 进 制 从 2433 开始 。 


2. 数 出 下 列 数字 后 面 的 10 个 数 (a) 八进制 从 466 开始 ,(b) 三 进 制 从 1201 Ft, Cc) 二 进 制 从 
11011 开始 ，(d) 五 进 制 从 3434 开始 。 


*3. 将 下 列 数字 从 二 进 制 转换 到 十 进 制 ， 假 定 是 无 符号 二 进 制 表示 法 : 


(a) 10010 (b) 110 (c) 1011 (d) 1000 (e) 11111 (f) 1010101 
4. 将 下 列 数字 从 二 进 制 转换 到 十 进 制 ， 假 定 是 无 符号 二 进 制 表示 法 : 

(a) 10010 (b) 10 (c) 1011 (d) 10000 (e) 1111 (f) 11110000 
*5 将 下 列 数 字 从 十 进 制 转换 到 二 进 制 ， 假 定 是 无 符号 二 进 制 表示 法 : 

(a) 25 (b) 16 (c) 1 (d) 14 (e) 5 (f) 41 
6. 将 下 列 数字 从 十 进 制 转换 到 二 进 制 ， 假 定 是 无 符号 二 进 制 表示 法 : 

(a) 12 (b) 35 (c) 3 (d) 0 (e) 27 (f) 16 


7. 采用 无 符号 二 进 制 表示 法 ， 下 列 单元 用 二 进 制 和 十 进 制 表示 的 表 数 范围 是 什么 ? 
*(a) 2 位 单元 * (b) 3 位 单元 (c) 4 位 单元 


(d) 5 位 单元 (e) n 位 单元 
*8. 执行 下 面 的 无 符号 加 法 运算 ,假定 是 7 位 单元 。 显 示 进 位 位 的 结果 。 
010 1011 101 1001 
(a) ADD 100 1001 (b) ADD 0110111 
C 三 C= 
111 1111 111 1111 
(ey ADD 1111111 (d) ADD 000 0001 
C= C= 139 
9. 执行 下 面 的 无 符号 加 法 运算 ， 假 定 是 9 位 单元 。 显 示 进 位 位 的 结果 。 
0 1000 1011 1 0001 1101 
(a) ADD 01101 0001 (b) ADD 01110 1000 
c= = c=  — 
LIITIN 11111 1111 
(c) ADD 00000 0001 (qd) ADD 111111111 
C= C= 


10. 假定 是 12 位 单元 ， 求 与 0110 0101 0111 相 加 ， 和 为 全 0 的 二 进 制 数 ， 即 求 下 面 运 算 中 缺失 的 数字 。 
0110 0101 0111 
ADD 222? 2222 2299 
0000 0000 0000 
求 出 的 数 可 能 会 把 进位 位 置 为 1。 不 看 3.2 节 ， 你 能 给 出 求 任 意 数 的 如 上 缺失 数字 的 通用 规则 吗 ? 
提示 : 一 个 简单 的 规则 涉及 NOT 运算 。 

11. 根据 3.1 节 ， 你 可 以 通过 看 1 的 位 置 上 的 数字 来 确定 二 进 制 数 是 奇数 还 是 偶数 ， 这 个 规则 对 任何 
基数 都 可 能 吗 ? 请 解释 。 i 

12. 八进制 和 十 进 制 之 间 的 转换 类 似 于 二 进 制 和 十 进 制 之 间 的 转换 。* (a) 写 出 图 3-4 所 示 的 八进制 数 
70146 的 多 项 式 表 达 。(b) 使 用 图 3-5 的 技巧 ， 把 7291 (dec) 转换 为 八进制 。 

13. 二 进 制 小 数 类 似 于 十 进 制 小 数 ， 它 包含 一 个 二 进 制 小 数 点 ， 而 不 是 十 进 制 小 数 点 。 a) 写 出 图 3-4 
所 示 的 十 进 制 数 29.458 的 多 项 式 表 达 。(b) 写 出 图 3-4 所 示 的 二 进 制 数 1011.100101 的 多 项 式 表 
达 。(c) 在 (b) 中 的 二 进 制 数 的 十 进 制 值 是 什么 ? 

14. 为 何 ISA3 层 的 程序 员 会 混淆 万 圣 节 (Halloween) 和 圣诞 节 (Christmas) ? 提示 : 31 (oct) 等 于 


TA? 

3.2 7 

*15. 将 下 列 数 从 十 进 制 转换 到 二 进 制 ， 假 定 用 7 位 补 码 二 进 制 表达 式 : 
(a) 49 (b) -27 (c) 0 
(d) -64 (e) -1 (f) -2 


(g) 这 人 台 计 算 机 二 进 制 和 十 进 制 的 数值 范围 是 什么 ? 140 
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16. 将 下 列 数 从 十 进 制 转换 到 二 进 制 ， 假 定 用 9 位 补 码 二 进 制 表达 式 : 
(a) 51 (b) -29 (c) -2 
(d) 0 (e) -256 (f) -1 
(g) 这 个 单元 二 进 制 和 十 进 制 的 数值 范围 是 什么 ? 

17. 将 下 列 数 从 二 进 制 转换 到 十 进 制 ， 假 定 是 7 位 补 码 二 进 制 表达 式 : 


(a) 001 1101 (b) 101 0101 (c) 111 1100 
(d) 000 0001 (e) 100 0000 (f) 100 0001 

18. 将 下 列 数 从 二 进 制 转换 到 十 进 制 ， 假 定 是 9 位 补 码 二 进 制 表达 式 : 
(a) 0 0001 1010 (b) 1 0110 1010 (c) 1 1111 1100 
(d) 0 0000 0001 (e) 1 0000 0000 (f) 1 0000 0001 


*19. 执行 下 面 的 加 法 运算 ， 假 定 是 7 位 补 码 二 进 制 表示 。 显 示 状 态 位 的 结果 : 
(a) 010 1011 (b) 111 1001 


ADD 000 1110 ADD 0001101 
N= N = 
Z = Z = 
V = V = 
(c) 100 0110 (d) 110 0001 
ADD 101 0101 ADD 111 0101 
N = N = 
V = V = 
C = = 
(e) 000 1101 (f) 100 1001 
ADD 011 0100 ADD 010 1011 
N = = 
Z = 7 = 
= V = 
C = = 
20. 执行 下 面 的 加 法 和 运算， 假定 是 9 位 补 码 二 进 制 表示 。 显 示 状 态 位 的 结 采 : 
(a) 01010 1100 (b) 11110 0101 
ADD 00011 1010 ADD 00011 0101 
N = N = 
Z= 4 一 
V = = 
C = = 
(c) 0 0001 1011 (d) 1 1000 0101 
ADD 101010100 ADD 01101 0110 
N = N= 
Z = 7 = 
V = 一 
C= C= 
(e) 0 0011 0100 (f) 1 0010 0111 
ADD 01101 0010 ADD 01010 0111 
N= N= 
Z = Z = 
V = V = 


21. 用 补 码 二 进 制 表示 ， 下 列 单 元 二 进 制 和 十 进 制 表 数 范围 是 什么 ? 
*(a) 2 位 单元 (b) 3 位 单元 (c) 4 位 单元 
(d) 5 位 单元 / (e) n 位 单元 


3.3 节 
*22. 假定 是 7 位 单元 ， 执 行 下 面 的 逻辑 运算 : 
(a) 010 1100 (b) 000 1111 (c) 010 1100 
ADD 110 1010 ADD 101 0101 OR 110 1010 
N = N = N = 
Z = 一 Fg = 
(d) 000 1111 (e) 010 1100 (f) 000 1111 
OR 101 0101 XOR 1101010 XOR 1010101 
Z = Z = = 
(g) NEG 010 1100 (h) NOT 1101010 
23. 假定 是 9 位 单元 ， 执 行 下 面 的 逻辑 运算 : 
(a) 0 1001 0011 (b) 0 0000 1111 (c) 0 1001 0011 
ADD 101110101 ADD 101110101 OR 101110101 
N = N = 一 
Z = Z = Z = 
(d) 0 0000 1111 (e) 0 1001 0011 (f) 0 0000 1111 
OR 1 0111 0101 XOR 101110101 XOR 101110101 
(g) NEG 1 1001 0011 (h) NOT 10111 0101 


*24. 假定 是 7 位 补 码 二 进 制 表示 ， 将 下 列 数字 从 十 进 制 转换 到 二 进 制 ， 给 出 ASL 运算 的 结果 ， 再 把 它 
转换 回 十 进 制 。 用 ASR 运算 再 做 一 次 。 对 于 ASL， 给 出 对 NZVC 位 的 影响 。 对 于 ASR， 给 出 对 
NZC 位 的 影响 。 

(a) 24 (b) 37 (c) -26 
(d) 1 (e) 0 (f) -1 

25. 假定 是 9 位 补 码 二 进 制 表 示 ， 将 下 列 数字 从 十 进 制 转换 到 二 进 制 ， 给 出 ASL 运算 的 结果 ， 接 着 把 
它 转 换 回 十 进 制 。 用 ASR 运算 再 做 一 次 。 对 于 ASL， 给 出 对 NZVC 位 的 影响 。 对 于 ASR， 给 出 
对 NZC 位 的 影响 。 

(a) 94 (b) 135 (c) -62 

(d) 1 (e) 0 (f) -1 
26.(a) Bik 6 位 单元 算术 右 移 的 RTL 描述 。(b) 写 出 16 位 单元 算术 左 移 的 RTL 描述 。 
*27. 假定 是 7 位 单元 ， 给 出 在 C 的 初始 值 下 ， 各 个 数 的 循环 位 移 运算 结果 : 


(a) C = 1, ROL 010 1101 ‘ (b)C=0, ROL 010 1101 

(c) C=1, ROR 010 1101 (d) C=0, ROR 010 1101 
28. 假定 是 9 位 单元 ， 给 出 在 C 的 初始 值 下 ， 各 个 数 的 循环 位 移 运 算 结 果 : 

(a) C = 1, ROL 0 0110 1101 (b) C = 0, ROL 0 0110 1101 

(c)C = 1, ROR 00110 1101 (d) C = 0, ROR 0 0110 1101 
29. (a) Bik 6 位 单元 循环 右 移 的 RTL RA. (b) Bit 16 位 单元 循环 左 移 的 RTL 表述 。 
3.45 


30. 从 下 面 的 数 开 始 ， 往 后 数 5 个 十 六 进 制 数 : 
* (a) 3AB7 (b) 6FD (c) BE 
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31. 将 下 列 十 六 进 制 数 转换 到 十 进 制 : 


* (a) 2D5E (b) 2F (c) 7 
32. 本 章 提 到 了 从 十 进 制 到 十 六 进 制 的 转换 方法 ,但 是 没有 给 出 例子 。 采 用 该 方法 把 下 列 数 从 十 进 制 
ig 转换 到 十 六 进 制 : 
143 * (a) 26831 (b) 4096 (c) 9 


33. 把 十 进 制 数 转换 到 二 进 制 数 的 方法 稍 加 改动 ， 就 能 把 十 进 制 数 转换 到 任何 基数 。( a) 解释 从 十 进 
制 转换 到 八进制 的 方法 。(b) 解释 从 十 进 制 转 到 基数 n 的 方法 。 
*34. 假定 是 7 位 补 码 二 进 制 表 示 ， 将 下 面 的 数 从 十 六 进 制 转换 到 十 进 制 ， 记 得 要 检查 符号 位 : 


(a) 5D (b) 2F (c) 40 
35. 假定 是 9 位 补 码 二 进 制 表示 ， 将 下 面 的 数 从 十 六 进 制 转换 到 十 进 制 ， 记 得 要 检查 符号 位 : 
(a) 1B4 (b) OF5 (c) 100 
*36. 假定 是 7 位 补 码 二 进 制 表 示 ， 写 出 下 面 十 进 制 数 的 十 六 进 制 位 模式 : 
(a) -27 (b) 63 (c) =1 
37. 假定 是 9 位 补 码 二 进 制 表示 ， 写 出 下 面 十 进 制 数 的 十 六 进 制 位 模式 : 
(a) 一 73 (b) -1 (c) 94 


*38. 将 下 面 加 密 的 ASCII 消息 解码 (横着 读 ) 
100 1000 110 0001 111 0110 110 0101 
010 0000 110 0001 0100000 1101110 
110 1001 110 0011 110 0101 010 0000 
110 0100 110 0001 111 1001 010 0001 

39. 将 下 面 加 密 的 ASCII 消息 解码 (横着 读 ) 
100 1101 110 0101 110 0101 111 0100 
010 0000 110 0001 111 0100 010 0000 
110 1101 110 1001 110 0100 110 1110 
110 1001 110 0111 110 1000 111 0100 
010 1110 

*40. 下 面 的 9 个 字符 的 字符 串 是 以 ASCH 怎样 存储 的 ? 

Pay $0.92 

. 下面 的 13 个 字符 的 字符 串 是 以 ASCII 怎样 存储 的 ? 


(321)497-0015 


42. 你 是 和 上 斯 洛 波 维 亚 打仗 的 下 斯 洛 波 维 亚军 队 的 首席 通信 官 ， 为 了 获得 斯 洛 波 维 亚 的 领地 ， 你 的 
间谍 将 潜入 敌人 的 指挥 中 枢 。 你 知道 上 斯 洛 波 维 亚 正 在 策划 一 次 重要 的 攻击 ， 你 也 知道 下 列 情 
Bie: (1) 攻击 的 时 间 是 日 落 或 日 出 , (2) 攻击 将 通过 陆地 、 空 中 或 者 大 海 , (3 ) 攻击 将 会 在 3 月 
28、29、30、31 或 者 4 月 1 日 进行 。 你 的 间谍 必须 用 二 进 制 和 你 通信 ， 设 计 一 个 合适 的 二 进 制 编 
144 码 用 来 传递 这 些 信息 ， 尽 可 能 使 用 最 少 的 位 数 。 
43. 有 时 候 八进制 用 于 代替 十 六 进 制 来 表示 位 序列 。 
* (a) 一 个 八进制 数 代表 多 少 位 ? 
在 下 面 的 单元 ， 如 何 用 八进制 来 表示 十 进 制 数 -13 ? 


_ 


(b) 15 位 单元 (c) 16 位 单元 (d) 8 位 单元 
35h 
*44. 把 下 列 数 从 二 进 制 转换 到 十 进 制 : 

(a) 110.101001 (b) 0.000011 (c) 1.0 


45. 把 下 列 数 从 二 进 制 转换 到 十 进 制 : 
(a) 101.101001 (b) 0.000101 (c) 1.0 
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*46. 把 下 列 数 从 十 进 制 转换 到 二 进 制 : 


(a) 13.156 25 (b) 0.039 0625 (c) 0.6 
47. 把 下 列 数 从 十 进 制 转换 到 二 进 制 : 
(a) 12.281 25 (b) 0.023 4375 (c) 0.7 


48. 做 一 个 类 似 图 3-30 的 表 ， 可 以 比较 4 位 单元 的 所 有 余 7 码 和 补 码 。 

49. (a) HR 7 码 表示 法 ，4 位 单元 以 二 进 制 和 十 进 制 表示 的 表 数 范围 是 什么 ? (b) AA 15 码 表示 法 ， 
5 位 单元 以 二 进 制 和 十 进 制 表示 的 表 数 范围 是 什么 ? (c) 用 余 2 一 -1 码 表 示 法 ，n 位 单元 以 二 进 制 
和 十 进 制 表 示 的 表 数 范围 是 什么 ? 

50. 假定 是 3 位 指数 字段 和 4 位 有 效 位 数 ， 写 出 下 列 十 进 制 值 的 位 模式 : 


* (a) -12.5 (b) 13.0 (c) 0.43 (d) 0.101 562 5 
(d) 0.5 (e) 0.6 (f£) 256.015 625 
51. 假定 是 3 位 指数 字段 和 4 位 有 效 位 数 ， 下 面 位 模式 表示 的 十 进 制 值 是 什么 : 
* (a) 0010 1101 (b) 1 101 0110 (c) 1111 1001 
(d) 0 001 0011 (e) 1 000 0100 (f) 0 111 0000 
52. 采用 IEEE 754 单 精 度 浮 点 数 表 示 法 ， 写 出 下 面 十 进 制 值 的 十 六 进 制 表示 : 
2 (c) -0.0 
(d) 0.5 (e) 0.6 (f) 256.015 625 145 
53. 采用 IEEE 754 单 精 度 浮 点 数 表示 法 ， 下 面 用 十 六 进 制 表示 的 数 的 二 进 制 科学 计数 法 表示 是 什么 : 
* (a) 4280 0000 (b) B350 0000 (c) 0061 0000 
(d) FF80 0000 (e) 7FE4 0000 (f) 8000 0000 
54. KH IEEE 754 单 精 度 浮 点 数 表示 法 ， 写 出 下 列 数 的 十 六 进 制 表示 : 
(a) IES (b) 最 小 正 的 非 规格 化 数 (c) 最 大 正 的 非 规格 化 数 
(d) 最 小 正 的 规格 化 数 (e) 1.0 (f) 最 大 正 的 规格 化 数 
(g) 正 无 穷 大 
55. 采用 IEEE 754 双 精 度 浮 点 数 表示 法 ， 写 出 下 列 数 的 十 六 进 制 表示 : 
(a) IES (b) 最 小 正 的 非 规格 化 数 (c) 最 大 正 的 非 规格 化 数 
(d) 最 小 正 的 规格 化 数 ”(e) 1.0 (f) 最 大 正 的 规格 化 数 
(g) 正 无 穷 大 
问题 
3.1 节 


56. 用 C++ 写 一 个 程序 ， 输 入 一 个 4 位 八进制 数 ， 打 印 它 后 面 的 10 个 八进制 数 。 用 int octNum[4]; 
来 定义 一 个 八进制 数 ， 用 octNum[0] 存储 最 高 的 ( 即 最 左 的 ) 八进制 位 ，octNum[3] 为 最 低 的 
八进制 位 = 采用 交互 式 输入 来 测试 你 的 程序 。 

57. 用 C++ 写 一 个 程序 ， 输 入 一 个 8 位 二 进 制 数 ， 打 印 它 后 面 的 10 个 二 进 制 数 。 用 int binNum[4]; 
来 定义 一 个 八进制 数 ， 用 binNum[0] 存储 最 高 的 ( 即 最 左 的 ) 位 ，binNum[7] 为 最 低位 。 请 用 
户 输入 第 一 个 二 进 制 数字 ， 每 位 用 至 少 一 个 空格 分 开 。 

58. 用 C++ 写 一 个 函数 ， 把 8 位 无 符号 二 进 制 数 转换 为 十 进 制 正 整数 ， 使 用 问题 57 中 的 二 进 制 数 定 
义 。 采 用 交互 式 输 入 来 测试 你 的 函数 。 146 

59. 用 C++ 写 一 个 空 函 数 ， 把 十 进 制 正 整 数 转 换 为 8 位 无 符号 二 进 制 数 。 使 用 问题 57 中 的 二 进 制 数 
定义 。 采 用 交互 式 输入 来 测试 你 的 空 函 数 。 

60. 像 问题 57 那样 定义 一 个 二 进 制 数 ， 写 一 个 空隙 数 


void BinaryAdd (int* sum, int& cBit, 
const int* binl, const int* bin2) 


148 
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来 计算 两 个 二 进 制 数 binl 和 bin2 的 和 sum. cBit 是 加 法 运算 后 进位 位 的 值 。 采 用 交互 式 输入 
来 测试 你 的 空 函 数 。 
i 
61. H C++ 写 一 个 函数 ， 把 8 位 补 码 二 进 制 数 转 换 为 十 进 制 整数 ， 使 用 问题 57 的 二 进 制 数 定义 。 采 
用 交互 式 输 入 来 测试 你 的 函数 。 
62. 用 C++ 写 一 个 空 函 数 ， 把 十 进 制 整数 转换 为 8 位 补 码 二 进 制 数 ， 使 用 问题 57 的 二 进 制 数 定义 。 
采用 交互 式 输 入 来 测试 你 的 空 函数 。 
3.2 节 
63. 像 问题 57 那样 定义 一 个 二 进 制 数 ， 写 一 个 空 陋 数 
void BinaryAnd (int* bAnd, 
const int* binl, const int* bin2) 
来 计算 两 个 二 进 制 数 binl 和 bin2 的 AND 运算 值 pAnd。 采 用 交互 式 输入 来 测试 你 的 空 函数 。 
64. 写 一 个 问题 63 ARPES PHL, EA OR 运算 。 
65. 像 问题 57 那样 定义 一 个 二 进 制 数 ， 写 一 个 函数 
void ShiftLeft (int* binNum, int& cBit) 
来 对 binNum 执行 算术 左 移 运 算 ，cBit 是 位 移 后 的 进位 位 的 值 。 采 用 交互 式 输入 来 测试 你 的 函数 。 
66. 写 一 个 问题 65 那样 的 函数 ， 执 行 算术 右 移 运算 。 
3.4 节 
67. 用 C++ 写 一 个 程序 ， 输 入 一 个 4 位 十 六 进 制 数 ， 打 印 它 后 面 的 10 个 十 六 进 制 数 。 用 int hexNum[4] 
定义 一 个 十 六 进 制 数 ， 十 六 进 制 的 输入 /输出 采用 大 写字 母 ， 例 如 ，3C6F 是 合法 的 输入 。 
68. 用 C++ 写 一 个 函数 ， 把 4 位 十 六 进 制 数 转换 为 十 进 制 正 整数 ， 使 用 问题 67 中 十 六 进 制 数 的 定义 。 
采用 交互 式 输入 测试 你 的 函数 ， 十 六 进 制 输入 采用 大 写字 母 。 
69. 用 C++ 写 一 个 空 函数 ， 把 十 进 制 正 整 数 转换 为 4 位 十 六 进 制 数 ,使 用 67 题 中 十 六 进 制 数 的 定义 。 
采用 交互 式 输 入 测试 你 的 空 函 数 ， 十 六 进 制 输出 采用 大 写字 母 。 
70. 用 C++ 写 一 个 函数 ， 把 4 位 十 六 进 制 数 转换 为 可 能 为 负 的 十 进 制 整数 ， 使 用 问题 67 中 十 六 进 制 数 
的 定义 ， 假 定 十 六 进 制 值 代 表 一 个 补 码 表示 的 16 位 单元 。 采 用 交互 式 输 入 测试 你 的 空 函 数 ， 十 六 
进 制 输入 采用 大 写字 母 。 
.用 Ct++ 写 一 个 空 函数 ， 把 可 能 为 负 的 十 进 制 整数 转换 为 4 位 十 六 进 制 数 ,， 使 用 问题 67 中 十 六 进 
制 数 的 定义 ， 假 定 十 六 进 制 值 代表 一 个 补 码 表示 的 16 位 单元 。 采 用 交互 式 输入 测试 你 的 空隙 数 ， 
十 六 进 制 输出 采用 大 写字 母 。 
72. 用 C++ 写 一 个 函数 ， 把 一 个 任意 基数 的 正 数 转换 到 十 进 制 。 例 如 ， 对 于 4 位 、 基 数 为 6 的 数字 ， 
声明 : 
const int base = 6; 


const int numDigits = 4; 
int number[numDigits]; 


采用 交互 式 输入 测试 你 的 函数 。 把 要 转换 的 数 读 入 一 个 字符 数组 ， 如 果 基 数值 需要 ， 使 用 大 写字 母 
输入 。 写 一 个 空 函数 ， 在 转换 为 十 进 制 前 ， 把 它 转换 为 适当 的 int 数组 类 型 的 值 。 

必须 能 够 通过 仅 改 变 常 量 base 就 可 以 修改 你 的 程序 ， 使 其 用 于 其 他 不 同 基数 的 运算 ; 必须 能 
够 通过 仅 改变 常量 numDigits 就 可 以 修改 程序 ， 使 其 用 于 不 同 的 位 数 。 

73. 用 C++ 写 一 个 空 也 数 ， 把 一 个 十 进 制 正 整 数 转换 为 任意 基数 的 数 。number 的 声明 与 问题 72 中 一 

样 。 采 用 交互 式 输入 测试 你 的 程序 ， 如 果 基 数值 需要 ， 使 用 大 写字 母 输 出 。 

必须 能 够 通过 只 改变 常量 base 就 可 以 修改 你 的 程序 ， 使 其 用 于 其 他 不 同 基数 的 运算 ; 必须 能 
够 通过 仅 改 变 常 量 numDigits 就 可 以 修改 程序 ， 使 其 用 于 不 同 的 位 数 。 
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计算 机 体系 结构 





建筑 师 把 墙 、 门 和 和 天花板 这 些 部 件 组 合 在 一 起 形成 建筑 物 。 类 似 地 ， 计 算 机 以 构 师 把 输 
入 设备 、 内 存 和 CPU 寄存 器 组 合 在 一 起 形成 计算 机 。 

建筑 物 有 各 种 形状 和 大 小 ， 计 算 机 也 是 。 这 就 提出 一 个 问题 : 如 果 我 们 选择 一 台 计 算 
机 ， 研 究 几 十 种 流行 的 可 用 模型 ， 那 么 当 这 些 模型 不 可 避免 地 被 生产 商 停 用 时 ， 我 们 的 知识 
多 多 少 少 都 会 有 些 过 时 。 同 样 ， 对 于 那些 使 用 我 们 没有 选 研 究 的 计算 机 的 人 ， 这 本 书 的 价值 
也 会 较 低 。 

但 是 又 有 另 一 种 可 能 性 。 一 本 关于 建筑 学 的 书 可 以 观察 一 栋 假 想 的 建筑 物 ， 同 样 道 理 ， 
这 本 书 可 以 探索 一 台 虚 拟 的 计算 机 ， 这 人 台 虚 拟 计 算 机 包含 类 似 于 能 在 所 有 真实 计算 机 上 找到 
的 特性 。 这 种 方法 有 它 的 优势 和 劣势 。 

虚拟 计算 机 的 一 个 好 处 是 它 可 以 被 设计 成 仅 用 以 说 明 适 用 于 大 多 数 计算 机 系统 的 基本 概 
念 ， 那么 我 们 可 以 专注 于 要 点 而 不 用 理会 真实 计算 机 各 自 的 奇特 属性 。 专 注 于 基本 原理 也 能 
避免 知识 过 时 ， 市 场 上 各 种 计算 机 来 来 去 去 ， 基 本 原理 总 会 继续 适用 。 

学 习 虚 拟 计算 机 的 主要 劣势 是 ， 它 的 一 些 细节 对 在 汇编 语言 层 或 指令 集 架 构 层 使 用 特定 
真实 机 器 工作 的 人 来 说 关系 不 大 。 不 过 ， 如 果 理 解 了 基本 概念 ， 就 可 以 很 容易 地 学 会 任何 特 
定 机 器 的 细节 。 

对 于 这 个 两 难 困 境 没 有 100% 满意 的 解决 方案 。 我 们 选择 虚拟 计算 机 的 方法 是 因为 它 能 
够 曾 释 基础 概念 。 我 们 假设 的 机 妖 叫 作 Pep/8 计算 机 。 


4.1 硬件 


Pep/8 硬件 在 指令 集 架 构 层 (ISA3 层 ) 主要 由 4 部 分 组 成 : 

e 中 央 处 理 单元 (CPU) 

o 主 存储 器 

e 输入 设备 

© 输出 设备 

图 4-1 的 框图 把 每 个 组 成 部 分 用 一 个 方 框 表示 。 总 线 是 连接 4 个 主要 组 成 部 分 的 一 组 线 
路 ， 它 承载 方 框 之 间 传 送 的 数据 信号 和 控制 信号 。 





一 了 数据 流 
一 > 控制 


图 4-1 Pep/8 计算 机 的 组 成 框图 
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4.1.1 中 央 处 理 单元 


中 央 处 理 单元 (CPU) 包含 6 个 专用 内 存单 元 ， 叫 作 寄 存 器 。 如 图 4-2 所 示 ， 它 们 是 
© 4 位 状态 寄存 硕 (NZVC) 
e 16 位 累加 器 (A) 


Central processing unit (CPU) 


e 16 位 变 址 寄存 器 (X) 状态 位 ( NZVC ) TT 

© 16 位 程序 计数 器 (PC) zma cao [TTITITITIITITITT] 
e 16 位 栈 指针 (SP) 变 址 寄存 器 (X) [TT TTT 
o 24 位 指令 寄存 项 (IR) 


状态 寄存 器 中 的 N、Z、V 和 C 与 3.1 节 和 3.2 patria anini 
节 讨 论 的 一 样 ， 分 别 是 负 ， 零 、 溢 出 和 进位 位 。| AA “时 FTT 
累加 器 是 包含 运算 结果 的 寄存 器 。 接 下 来 的 3 个 nean |p 
寄存 器 一 X、PC 和 SP， 帮 助 CPUAFRE 
的 信息 。 变 址 寄存 器 用 来 访问 数组 的 元 素 ， 程 序 图 4-2 Pep/8 计算 机 的 中 央 处 理 单元 
计数 器 用 来 访问 指令 ， 栈 指针 用 来 访问 运行 时 栈 
上 的 元 素 。 指 令 寄存 器 保存 从 内 存 中 取出 的 指令 。 
除了 这 6 个 寄存 器 外 ，CPU 还 包含 执行 Pep/8 指令 的 所 有 电子 器 件 (在 图 4-2 中 未 显示 )。 


41.2 +a 


图 4-3 展示 了 Pep/8 计算 机 的 主 存储 硕 。 它 包含 65 536 个 8 位 内 存单 元 。 一 个 8 个 位 的 组 
称 为 1 字 节 (byte， 读 作 bite)。 类 似 于 邮箱 上 的 数字 地 址 ， 每 字 节 都 有 一 个 地 址 ， 地 址 范围 以 
十 进 制 表示 是 从 0 ~ 65535， 十 六 进 制 表示 是 从 0000 ~ FFFF。 主 存储 器 有 时 称 为 核心 存储 器 。 

图 4-3 在 第 一 行 展 示 了 主 存 的 前 3 个 字 节 ， 第 二 行 是 接 下 来 的 字 节 ， 再 下 一 行 是 接 下 来 
的 3 个 字 节 ， 而 在 最 后 一 行 是 最 后 2 个 字 节 。 把 一 行内 存 看 作 包 含 1 个 、2 个 还 是 3 个 字 节 
取决 于 问题 的 上 下 文 。 有 了 时候， 把 一 行 看 作 一 个 字 节 更 方便 ， 而 有 时 是 2 个 或 者 3 个 更 方 
便 。 当 然 ， 在 物理 计算 机 里 ，1 个 字 节 是 存储 于 电子 电路 中 的 8 个 信号 序列 。 字 节 在 物理 上 
的 排列 不 会 像 图 中 所 示 的 那样 。 

通常 如 图 44 所 示 的 那样 画 主 存 是 很 方便 的 ， 把 地 址 写 在 块 的 左边 。 尽 管 看 上 去 每 行 方 框 的 
宽度 相等 ， 但 是 一 行 可 以 代表 1 个 字 节 或 者 几 个 字 节 。 方 框 边 上 的 地 址 是 本 行 最 左边 字 节 的 地 址 。 





主 存储 器 





图 4-3 Pep/8 计算 机 的 主 存储 器 图 4-4“ 另 一 种 描述 主 存储 器 的 方式 
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可 以 通过 地 址 序列 知道 一 行 包含 多 少 字 节 。 在 图 4-4, 1 行 一 定 是 3 个 字 节 ， 因 为 
第 2 行 的 地 址 是 0003 ; 第 2 行 一 定 是 1 个 字 节 ， 因 为 第 3 行 的 地 址 是 0004， 比 0003 大 1。 
类 似 地 ， 第 3 行 和 第 4 行 每 行 有 3 个 字 市 ， 第 5 行 有 1 字 节 ,第 6 行 有 2 个 字 节 ， 从 图 4-4 
看 出 ， 不 可 能 知道 第 7 行 有 多 少 字 节 。 图 4-4 的 前 3 行 对 应 图 4-3 的 前 7 个 字 节 。 

无 论 在 纸 上 怎 么 画 主 存 字 节 ， 都 把 小 地 址 的 字 节 称 为 内 存 的 “顶部 "， 大 地 址 的 字 节 称 
为 内 存 的 “底部 ”。 

大 多 数 计算 机 厂商 指定 一 个 字 是 一 定数 量 的 字 节 。 在 Pep/8 
计算 机 中 ， 一 个 字 是 两 个 相 邻 字 节 ， 因 此 ， 一 个 字 包 含 16 位 。 lololololololo 
在 Pep/8 CPU 中 的 大 多 数 寄存 器 是 字 寄 存 器 。 在 主 存 中 ， 一 个 ee 
字 的 地 址 是 这 个 字 第 一 个 字 节 的 地 址 。 例 如 ,图 4-5a 展示 了 [Lol fojojofi 
地 址 为 000B 和 000C 的 两 个 相 邻 字 节 ， 这 个 16 位 字 的 地 址 是 Oi oa 
nen a) 二 进 制 表 示 的 内 容 

区 别 内 存单 元 的 内 容 和 它 的 地 址 是 非常 重要 的 。Pep/8 计 算 | 2 | m | 
机 的 内 存 地 址 长 度 是 16 位 ， 因 此 图 4-5a 中 字 的 二 进 制 地 址 是 000B OQ. 
0000 0000 0000 1011， 但 是 位 于 这 个 地 址 的 字 的 内 容 是 0000 0010 BLT aE ae EE 
1101 0001。 不 能 把 字 的 内 容 和 它 的 地 址 搞 混 ， 它 们 是 不 同 的 。 ww 

为 了 节约 纸 面 上 的 空间 ， 字 节 或 字 的 内 容 通 常用 十 六 进 制 ORR TREE 
表示 。 图 4-5b 给 出 了 地 址 000B 的 字 以 十 六 进 制 表示 的 内 容 。 图 4-5 内 存 位 置 的 内 容 和 它 
在 机 器 语言 代码 中 ， 给 出 一 组 字 节 的 第 一 个 字 节 的 地 址 ， 然 后 POEL 
给 出 十 六 进 制 表示 的 内 容 ， 如 图 4-5c 所 示 。 用 这 种 格式 表示 ， 尤 其 容易 混 消 字 节 的 地 址 和 
它 的 内 容 。 

在 图 4-5 的 例子 中 ， 对 内 存单 元 的 内 容 有 多 种 解读 方法 。 如 果 把 位 序列 0000 0010 1101 0001 
看 作 补 码 表示 的 整数 ， 那 么 第 一 个 位 就 是 符号 位 ， 这 个 二 进 制 序列 表示 十 进 制 数 721。 如 果 
把 最 右边 7 MAWE ASCII 码 字 符 ， 那 么 这 个 二 进 制 序列 表示 字符 Q。 主 存 不 会 决定 以 何 种 
方式 来 解读 这 个 字 节 ， 它 只 记录 二 进 制 序 列 0000 0010 1101 0001. 


4.1.3 输入 设备 


你 可 能 想 知 道 Pep/8 便 件 在 哪里 ， 你 能 不 能 真 的 接触 它 。 答 案 是 ， 这 个 硬件 根本 不 存 
在 ! 至 少 作为 一 台 物 理 机 器 它 是 不 存在 的 ， 不 过 作为 一 组 可 以 在 计算 机 系统 上 执行 的 程序 ， 
它 是 存在 的 。 这 些 程序 模拟 这 些 章节 描述 的 Pep/8 机 器 的 行为 。 

Pep/8 系统 模拟 两 种 输入 设备 一 一 文本 文件 和 键盘 。 在 一 个 Pep/8 程序 中 不 能 同时 指定 
这 两 者 。 在 执行 一 个 程序 前 ， 必 须 指定 输入 来 自 于 文件 还 是 键盘 。 如 果 正 在 使 用 一 个 有 图 形 
用 户 接 口 的 模拟 条， 那么 输入 将 来 自 于 焦点 窗口 而 不 是 文件 。 


4.1.4 输出 设备 


Pep/8 系统 也 模拟 两 种 输出 设备 一 一 文本 文件 和 屏幕 。 与 输入 一 样 ， 不 可 以 在 一 个 
Pep/8 程序 中 同时 指定 这 两 者 。 如 果 指 定 文 本 文件 作为 输出 ， 那 么 系统 会 要 求 给 出 输出 文件 
的 文件 名 ， 然 后 系统 会 生成 该 文件 。 如 果 正 在 使 用 一 个 有 图 形 用 户 接口 的 模拟 器 ， 那 么 将 输 
出 到 一 个 新 窗口 ， 可 以 再 把 它 保 存 到 一 个 新 文件 中 。 
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4.1.5 数据 和 控制 


图 4-1 中 连接 方 框 的 实 线 是 数据 流 线 。 数 据 可 以 从 总 线 上 的 输入 设备 流向 主 存 ， 也 可 以 
从 总 线 上 的 主 存 流 向 CPU， 但 是 不 能 从 输入 设备 直接 流向 CPU. 

类 似 地 ， 数 据 不 能 直接 从 CPU 流向 输出 设备 。 如 果 想 把 数据 从 CPU 传送 到 输出 设备 ， 
必须 先 传送 到 主 存 ， 再 从 主 存 传送 到 输出 设备 。 

虚线 是 控制 线 。 控 制 信号 都 是 从 CPU 发 出 的 ， 也 就 是 说 ，CPU 控制 计算 机 的 所 有 其 他 
部 分 。 例 如 ， 要 使 数据 从 主 存 沿 着 实数 据 流 线 流 到 输出 设备 ，CPU 必须 沿 着 虚 控 制 线 给 内 
存 传送 一 个 发 送信 号 ， 给 输出 设备 一 个 接收 信号 。 处 理 器 是 真正 的 中 心 ， 它 控制 计算 机 所 有 
其 他 的 部 分 。 


4.1.6 ”指令 格式 


每 种 计算 机 都 有 它 自 己 的 指令 集 ， 固 化 在 CPU 中 。 厂 商 之 间 的 指令 集 是 不 同 的 。 许 多 
厂商 生产 一 个 系列 的 型 号 ， 每 个 型 号 和 本 系列 中 其 他 型 号 具有 相同 的 指令 集 ， 但 是 同一 家 公 
司 制造 的 计算 机 指令 集 经 常 不 一 样 。 

Pep/8 计算 机 的 指令 集 有 39 条 指令 ， 如 图 4-6 所 示 。 一 条 指令 要 么 是 一 个 字 节 ， 称 为 指 
令 指 示 符 (instruction specifier)， 要 么 是 指令 指示 符 后 紧 跟 一 个 称 为 操作 数 指示 符 (operand 
specifier) 的 字 。 没 有 操作 数 指示 符 的 指令 叫 作 一 元 指令 。 图 4-7 给 出 了 非 一 元 指令 和 一 元 指令 。 


指令 指示 符 指令 指示 符 指 令 
0000 0000 止 执行 未 实现 操作 码 ， 一 元 陷阱 
0000 0001 未 实现 操作 码 ， 非 一 元 陷阱 


0000 0010 | 将 栈 指针 (SP) 传送 到 累加 器 (A) 未 实现 操作 码 ， 非 一 元 陷阱 
0000 0011 将 NZVC 标志 传送 到 累加 器 (A) 未 实现 操作 码 ， 非 一 元 陷阱 


0000 010a 未 实现 操作 码 ， 非 一 元 陷阱 
0000 011a | 如 果 小 于 等 于 分支 
0000 1008 | 如 果 小 于 分支 


0000 101a | 如 果 等 于 分 支 从 调用 返回 ， 带 ”个 本 地 字 节 


0000 110a | 如 果 不 等 于 分 支 加 到 栈 指针 (SP) 
0000 111a 如 果 大 于 等 于 分 支 从 栈 指针 (SP) WA 
0001 000a 如 果 大 于 分 支 加 到 寄存 器 r 
0001 001a 如 果 V 分 支 从 寄存 器 r 减 去 
0001 010。 | AC HP 
0001 1017 | aah He 
0001 111r | AER r Wi 
0010 000 | aera AREER O ia | AREER EERIE 
0010 001r | 寄存 器 + 循环 有 移 OO 
图 4-6 Pep/8 AY ISA3 层 指 令 集 
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8 位 指令 指示 符 分 为 多 个 部 分 。 第 一 部 分 叫 作 操 作 码 ， 常 称 为 opcode。 操 作 码 是 4 一 8 
位 ， 例 如， 图 4-6 显示 了 把 栈 指针 移 到 累加 器 的 指令 有 8 位 操作 码 0000 0010， 而 字符 输入 
指令 有 5 位 操作 码 0100 1。 操 作 码 少 于 8 位 的 指令 ， 根 据 指令 的 不 同 ， 它 们 的 指令 指示 符 细 
分 为 多 个 字段 。 图 4-6 用 字母 a、r 和 n 来 标识 这 些 字 段 ， 每 个 字母 可 以 为 0 或 1。 

例 4.1 图 4-6 给 出 “branch if equal to ”指令 的 指令 指示 符 为 0000 101a。 因 为 字母 a 
可 以 为 0 或 1， 所 以 指令 有 两 种 版 本 一 一 0000 1010 和 0000 1011。 类 似 地 ， 十进制 输出 陷阱 
指令 有 8 种 版 本 ， 它 的 指令 指示 符 是 0011 laaa, aaa 可 以 是 从 000 到 111 的 任意 组 合 。 O 

图 4-8 总 结 了 字母 a 和 ?在 指令 指示 符 中 可 能 字段 的 含义 。 一 元 陷阱 指令 中 的 字母 nn 
和 从 调用 返回 指令 中 的 字母 nnn 的 含义 在 后 面 的 章节 中 进行 描述 。 

一 般 来 说 ， 字 母 a 代表 寻 址 方式 ,字母 r 代表 寄存 器 。 当 r 为 0 时 ， 指 令 对 累加 器 进行 
操作 ， 当 r 为 1 时， 指令 对 变 址 寄存 器 进行 操作 。Pep/8 的 非 一 元 指令 有 8 种 可 能 的 寻 址 方 
式 一 一 立即 、 直 接 、 间 接 、 栈 相对 、 栈 相对 间接 、 变 址 、 栈 变 址 和 栈 变 址 间接 ， 后 面 的 章节 
会 描述 寻 址 方式 的 含义 。 目 前 ， 只 需要 了 解 怎 样 使 用 图 4-7 和 图 4-8 中 的 表格 来 确定 一 条 给 
定 的 指令 使 用 的 是 什么 寄存 器 和 寻 址 方式 。 








000 | a | 。 寻 址 方式 
| 001 po [oe 
ss TITTI 
-= b) a HEFE: 
tC 
eae 
ie eee oe | | o | 累加 器 ,A 
sexe OTT] i | anae, x 
BAAN 
b) 一 元 指令 a) aaa 寻 址 字段 c) 寄存 器 T 字 段 
图 4-7 Pep/8 的 指令 格式 图 4-8 Pep/8 的 指令 指示 符 字段 


例 4.2 确定 1100 1011 指令 的 操作 码 、 寄 存 器 和 寻 址 方式 。 从 左边 开始 ， 根 据 图 4-6, 
操作 码 是 1100， 操 作 码 后 面 的 1 位 是 rz 位 ， 值 为 1， 表示 变 址 寄存 器 , r 位 后 面 是 aaa 位 ， 
值 为 011 ， 表 示 栈 相对 寻 址 。 因 此 这 条 指令 使 用 栈 相 对 寻 址 方式 将 内 存 中 一 个 值 载 人 变 址 寄 
存 器 中 。 

对 于 非 一 元 指令 ， 操 作 数 指示 符 表明 指令 要 处 理 的 操作 数 。 根 据 指令 指示 符 中 的 某 些 
位 ，CPU 有 多 种 不 同 的 解读 操作 数 指示 符 的 方法 。 例 如 ， 可 以 把 操作 数 指示 符 当 作 ASCII 
字符 、 补 码 表示 的 整数 或 者 存储 操作 数 的 主 存 地 址 。 

指令 存储 于 主 存 中 ， 一 条 指令 的 地 址 是 该 指令 第 一 个 字 节 的 地 址 。 

例 4.3 图 4-9 展示 了 存储 于 主 存 地 址 01A3 和 
01A6 的 两 条 相 邻 的 指令 ，01A6 的 指令 是 一 元 指令 ， 
01A3 的 指令 则 不 是 。 

在 这 个 例子 中 ，01A3 的 指令 表示 

操作 码 : 1000 

寄存 器 -r FE: 1 

寻 址 -aaa 字段 : 101 图 4-9 主 存 中 的 两 条 指令 


L 


主 存储 器 
10001101| 100000011 [01001110 


01A3 01A4 01A5 







00011110 
01A6 
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操作 数 指示 符 : 0000 0011 0100 1110 
这 里 ， 所 有 的 数 都 是 二 进 制 的 。 根 据 图 4-6 的 操作 码 表 ， 这 是 减法 指令 。 寄 存 器 -r SER 
明 要 操作 的 是 变 址 寄存 器 而 不 是 累加 器 。 这 条 指令 是 把 变 址 寄存 器 的 内 容 减 去 操作 数 。 寻 
ht -aaa 字段 表示 变 址 寻 址 ， 所 以 对 操作 数 指示 符 做 相应 的 解读 。 在 本 章 中 ， 我 们 的 学 习 仅 
限于 直接 寻 址 ， 其 他 模式 会 在 后 面 的 章节 中 讲解 。 

01A6 的 一 元 指令 表示 


操作 码 : 0001 111 

寄存 器 -T 字段 : 0 

操作 码 表示 这 条 指令 是 做 算术 右 移 ， 寄 存 器 -r 字段 表明 要 进行 右 移 的 是 累加 器 。 因 为 
这 是 个 一 元 指令 ， 所 以 没有 操作 数 指 示 符 。 口 


在 例 4.3 中 ， 下 面 的 指令 格式 称 为 机 器 语言 : 

1000 1101 0000 0011 0100 1110 

0001 1110 

机 器 语言 ( machine language) 是 二 进 制 序列 ( 即 0 和 1 的 序列 )，CPU 根据 它 的 指令 集 
操作 码 进 行 解 恋 。 机 咒语 言 代 码 会 在 内 存 地 址 后 面 用 十 六 进 制 表示 这 两 条 指令 ， 如 下 所 示 : 

01A3 8D034E 

01A6 IE 

如 果 只 有 指令 的 十 六 进 制 表示 ， 那 么 必须 把 它 转换 为 二 进 制 ， 检 查 指令 指示 符 字 段 的 内 
容 来 确定 这 条 指令 是 做 什么 的 。 


4.2 直接 寻 址 


本 节 讲 述 ISA3 层 上 某 些 Pep/8 指令 的 操作 ， 这 些 指 令 如 何以 直接 寻 址 方式 进行 运算 。 
后 面 的 章节 将 讲述 其 他 寻 址 方式 。 

寻 址 字段 决定 了 CPU 怎样 解读 操作 数 指示 符 。 寻 址 -aaa 字段 001 表示 直接 寻 址 。 如 果 采 
用 直接 寻 址 ，CPU 会 把 操作 数 指示 符 解 释 为 包含 操作 数 的 主 存单 元 地 址 。 用 数学 符号 表示 是 

Oprnd = Mem[OprndSpec] 

这 里 Oprnd 表示 操作 数 ，OprndSpec 表示 操作 数 指示 符 ，Mem 表示 主 存 。 

方 括号 表示 你 可 以 把 主 存 想象 成 一 个 数组 ， 把 操作 数 指示 符 想 象 成 数组 的 索引 。 在 C++ 
H, WR v 是 数组 ,i 是 整数 ， 则 v[i] 是 由 整数 i 的 值 所 确定 的 数组 中 的 “单元 " 。 类 似 地 ， 
指令 中 的 操作 数 指示 符 标 识 主 存 中 包含 操作 数 的 单元 。 

接 下 来 要 讲 的 是 某 些 Pep/8 指令 集 的 指令 ， 每 条 指令 的 描述 都 会 列 出 操作 码 ， 并 举 一 个 
使 用 直接 寻 址 的 指令 操作 的 例子 。N、Z、V 和 C 的 值 都 以 二 进 制 的 形式 给 出 ， 其 他 寄存 器 
和 内 存单 元 的 值 是 用 十 六 进 制 表 示 的 。 在 机 器 层 ， 所 有 的 值 最 终 都 是 二 进 制 的 。 在 讲述 完 每 
条 指令 之 后 ， 本 章 结尾 会 展示 怎样 用 它们 一 起 组 成 机 器 语言 程序 。 


4.2.1 停止 指令 

停止 指令 的 指令 指示 符 是 0000 0000。 执 行 这 条 指令 就 是 简单 地 让 计算 机 停 下 来 。Pep/8 
是 一 台 模 拟 的 计算 机 ， 通 过 运行 计算 机 上 的 模拟 器 来 执行 它 。 模 拟 器 有 命令 选项 菜单 供 你 选 
择 ， 选 项 之 一 就 是 执行 Pep/8 程序 。 当 Pep/8 程序 执行 时 遇 到 这 条 指令 时 ， 就 会 停止 并 把 模 
拟 堪 返回 到 命令 选项 菜单 。 停 止 执行 指令 是 一 元 指令 ， 它 没有 操作 数 指示 符 。 
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4.2.2” 装 入 指令 


装 和 人 指令 的 指令 指示 符 是 1100 raaa, CRH r 的 值 ， 把 1 个 字 (2 字 节 ) 从 内 存单 元 装 
入 累 加 器 或 者 变 址 寄存 器 。 它 影响 N 位 和 Z 位 。 如 果 操 作 数 是 负数 ， 就 把 NN 位 置 为 1 ; 否 
则 ， 把 N 位 置 为 0。 如 果 操 作 数 是 16 位 0， 就 把 Z 位 置 为 1; 否则 ,把 Z 位 置 为 0。 装 入 指 
令 的 寄存 器 传送 语言 (RTL) 描述 是 
r+ Oprnd; Nr<0,Z r=0 

例 4.4 假定 要 执行 指令 的 十 六 进 制 表示 是 C1004A， 图 4-10 给 出 了 二 进 制 表示 。 本 例 
中 寄存 器 -r 字 段 是 0， 表 示 装 人 累加 器 而 不 是 变 址 寄存 器 。 寻 址 -aa 字段 是 001， 表 示 是 
直接 寻 址 。 


指令 指示 符 操作 数 指示 符 
Opcode r aaa 


[1 10 ofofo 0 1] [00000000 01001010 
C l 0 0 4 A 
图 4-10 装 入 指令 


假定 Mem[004A] 的 初始 内 容 是 92EF， 图 4-11 展示 了 执行 装 入 指令 后 的 结果 。 装 人 指 
令 不 会 改变 内 存单 元 的 内 容 ， 它 把 两 个 内 存单 元 (地 址 004A 和 004B) 内 容 的 副本 发 送 到 寄 
存 器 。 无 论 指 令 执行 前 寄存 器 中 是 什么 ， 在 本 例 中 是 036D ， 它 都 会 被 覆盖 。 由 于 被 装 人 的 
位 模式 的 符号 位 是 1 ， 所 以 N 位 被 置 为 1。 该 位 模式 不 是 全 0， 因 此 Z 位 被 置 为 0。 装 人 指 
令 对 V 和 C 位 没有 影响 。 


CPU Mem 
Nz| | [92EF| | c10044 
004A | 累加 器 装 入 


[| | 


a) 装 人 之 前 b) 装 入 之 后 
图 4-11 装 人 指令 的 执行 


图 4-11 展示 了 装 和 指令 的 数据 流 和 控制 流 。 如 实 线 所 示 ， 数 据 流 从 总 线 上 的 主 存 到 
CPU， 然 后 再 到 寄存 器 。 为 了 进行 此 次 数据 传送 ，CPU 必须 向 主 存 发 送 控制 信号 ， 如 虚线 
所 示 ， 让 它 把 数据 放 到 总 线 上 。CPU 也 会 告知 主 存 到 哪个 地 址 取 数据 。 口 


4.2.3 存储 指令 


存储 指令 的 指令 指示 符 是 1110 raaa， 它 把 1 个 字 (2 字 节 ) 从 累加 器 或 者 变 址 寄存 器 存 
储 到 内 存单 元 。 对 于 直接 寻 址 ， 操 作 数 指定 信息 存储 的 内 存单 元 。 存 储 指令 的 RTL 描述 是 

Oprnd <r 

Bl 4.5 假定 要 执行 指令 的 十 六 进 制 表示 是 E9004A， 图 4-12 是 它 的 二 进 制 表示 。 这 
次 ， 寄 存 器 -字段 标明 指令 将 作用 于 变 址 寄存 锅 ， 寻 址 -aaa 字段 001 表示 直接 寻 址 。 

假定 变 址 寄存 器 的 初始 内 容 是 16BC， 图 4-13 展示 了 执行 存储 指令 后 的 结果 。 存 储 指令 
不 会 改变 寄存 右 的 内 容 ， 它 把 寄存 右 内 容 的 副本 发 送 到 两 个 内 存单 元 (地址 004A 和 004B ) 。 
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指令 指示 符 操作 数 指示 符 
Opcode r aaa 
E 9 0 0 4 A 
图 4-12 存储 指令 
无 论 指 令 执 行 前 内 存单 元 中 是 什么 ， 在 本 例 中 是 F082， 它 都 会 被 覆盖 。 存 储 指令 不 影响 任 
何 状态 位 。 口 
Mem GPU 
[16BC | Ea E9004A 
存 人 变 址 寄存 器 





a) 存储 之 前 b) 存储 之 后 
图 4-13 存储 指令 的 执行 


4.2.4 加 法 指令 


加 法 指令 的 指令 指示 符 是 0111 raaa。 类 似 于 装 入 指令 ， 加 法 指令 中 数据 也 从 主 存 传送 
到 CPU 的 寄存 器 -r ak 但 是 ， 对 于 加 法 指令 ， 寄 存 器 的 初始 内 容 不 会 被 来 自主 存 的 字 内 容 
改写 ， 而 是 把 这 个 字 的 内 容 和 寄存 器 的 内 容 相 加 ， 再 把 和 放 在 这 个 寄存 器 中 ， 并 相应 地 设置 
4 个 状态 位 。 与 装 人 指令 一 样 的 是 内 存 字 的 内 容 被 传送 到 CPU， 而 它 的 原始 内 容 不 会 改变 。 
加 法 指令 的 RTL 描述 是 
r«—r+Opmd; Ne=r<0 Zr?=0 { BiH },C— {HL} 

例 4.6 假定 要 执行 指令 的 十 六 进 制 表示 是 79004A， 图 4-14 是 它 的 二 进 制 表示 。 寄 存 
ar -字段 表示 指令 将 作用 于 变 址 寄存 器 ， 寻 址 -aaa 字段 001 表示 直接 寻 址 。 


指令 指示 符 操作 数 指示 符 
Opcode I aaa 
011 1/1/001]|00000000]/01001010 
7 9 0 0 4 A 


图 4-14 加 法 指令 


假定 变 址 寄存 器 的 初始 内 容 是 0005，Mem[0004] 是 -7 (dec) = FFF9 (hex), K 4-15 
展示 了 执行 加 法 指令 后 的 结果 。 在 十 进 制 中 ,5 +(-7 ) 是 -2， 在 图 4-15b 中 显示 为 FFFE (hex). 
图 中 NZVC 位 以 二 进 制 显 示 ， 因 为 和 是 负数 ， 所 以 N 位 是 1。 由 于 和 不 为 全 0， 所 以 Z 位 是 
0。 没 有 溢出 ， 因 此 V 位 是 0。 最 高 位 没有 进位 ， 因 此 C 位 是 0。 o 


CPU Mem 
NZVC [| 加 ee 
加 79004A 
X 
all | rere | 


a) 加 法 之 前 a 
图 4-15 ”加 法 指令 的 执行 
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4.2.5 ”减法 指令 


减法 指令 的 指令 指示 符 是 1000 raaa， 除 了 是 把 寄存 器 内 容 减 去 操作 数 外 ， 它 类 似 于 加 
法 指令 。 结 果 放 在 寄存 器 中 ， 操 作 数 不 会 被 改变 。 对 于 减法 ，C 位 表示 加 上 操作 数 的 负数 之 
后 的 进位 。 减 法 指令 的 RTL 描述 是 
r+—r—Opmd; N+-r<0,Z<-r=0,V< { #H},C-—{ #1} 

Bil 4.7 假定 要 执行 指令 的 十 六 进 制 表示 是 81004A， 图 4-17 是 它 的 二 进 制 表示 。 寄 存 
ar -字段 表示 指令 将 作用 于 累加 器 。 


指令 指示 符 操作 数 指示 符 

Opcode r aaa 

1000l0lI001||I00000000||01001010 
8 l 0 0 4 A 


图 4-16 减法 指令 


假定 累加 器 的 初始 内 容 是 0003，Mem[004A] Æ 0009, 图 4-17 显示 了 执行 减法 指令 后 
的 结果 。 在 十 进 制 中 ，3 减 去 9 的 差 是 -6， 在 图 4-17b 中 用 十 六 进 制 表 示 为 FFFA (hex). 
图 中 NZVC 位 以 二 进 制 显示 ， 因 为 和 是 负数 ， 所 以 N 位 是 1。 由 于 和 不 是 全 0， 所 以 Z 位 是 0。 
没有 溢出 ， 因 此 V 位 是 0。3 加 -9 时 没有 进位 ， 因 此 C 位 是 0。 口 


CPU Mem CPU 


Nzvc[ | 81004A |NZVC 
o | os | in | rea 





N 


a) 减法 之 前 b) 加 法 之 后 
图 4-17 减法 指令 的 执行 


4.26 与 和 或 指令 


与 (AND) 指令 的 指令 指示 符 是 1001 raaa, BK (OR) 指令 的 指令 指示 符 是 1010 raaa, 
两 条 指令 都 类 似 于 加 法 指令 。 这 些 指 令 对 寄存 器 执行 逻辑 运算 ， 而 不 是 把 操作 数 加 到 寄存 器 
H, AND 运算 可 以 帮助 掩 去 位 模式 中 不 希望 有 的 值 为 1 的 位 ，OR 运算 用 于 在 位 模式 中 往 
某 些 位 上 插入 1。 这 两 条 指令 对 N 和 2Z 位 都 有 影响 ， 但 不 会 改变 V 和 C 位 。 与 和 或 指令 的 
RTL 描述 是 
rer A Oprnd; N«+r<0,Z+«r=0 
rr V Oprnd; N«-r<0,Z<+«-r=0 

Bil 4.8 假定 要 执行 指令 的 十 六 进 制 表示 是 99004A， 图 4-18 是 它 的 二 进 制 表示 。 操 作 
码 表示 要 执行 与 指令 ， 寄 存 器 -r 字段 表示 指令 将 作用 于 变 址 寄存 器 。 


指令 指示 符 操作 数 指示 符 
Opcode r aaa 


roo foot] morro oo [io or 


9 9 0 0 4 A 
图 4-18 与 指令 
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假定 变 址 寄存 器 的 初始 内 容 是 SDC3，Mem[004A] 是 OOFF, FI 4-19 展示 了 执行 与 指令 
后 的 结果 。 在 二 进 制 中 ，00FF 是 0000 0000 1111 1111, Mem[004A] 每 个 值 为 1 的 位 所 对 应 
的 变 址 寄存 器 的 位 不 改变 ， 每 个 值 为 0 的 位 所 对 应 的 寄存 器 位 被 置 为 0。 图 中 以 二 进 制 展 
示 NZ 位 ， 因 为 变 址 寄存 器 的 数值 不 为 负 ， 所 以 N 位 是 0。 变 址 寄存 器 不 全 为 0， 因 此 Z 





位 是 0。 口 
CPU Mem 
NZ [| 99004A nz | 00 | 
. SEWA y 
CO 
a) 与 之 前 b) aero 


图 4-19 与 指令 的 执行 


例 4.9 图 4-20 展示 了 或 指令 的 运算 ， 除 了 指令 指示 符 的 操作 码 A9 是 1010 4h (RANE 
是 或 指令 )， 初 始 状态 和 例 4.8 一 样 。 这 次 ，Mem[004A] 每 个 值 为 0 的 位 所 对 应 的 变 址 寄存 
器 的 位 不 会 改变 ， 每 个 值 为 1 的 位 所 对 应 的 寄存 器 的 位 被 置 为 1。 如 果 把 变 址 寄存 器 当 作 有 
符号 整数 ， 其 值 不 为 负 ， 因 此 N 位 是 0。 口 


NZ = OOFF A9004A NZ 
x 004A | 或 变 址 寄存 器 | y a 





+ 
[| | a 
a) 与 之 前 b) 与 之 后 


图 4-20 ”或 指令 的 执行 
4.2.7 按 位 取 反 和 取 负 指令 


按 位 取 反 指令 的 指令 操作 符 是 0001 100r， 取 负 指 令 的 指令 操作 符 是 0001 101r。 两 条 指 
令 都 是 一 元 的 ， 它 们 没有 操作 数 指示 符 。 按 位 取 反 指令 对 寄存 器 执行 NOT 运算 ， 即 每 位 1 
变 为 0，0 变 为 1。 它 影响 N 和 Z 位 。 按 位 取 反 指令 的 RTL 描述 是 
r—sf Ne r<0, Z—r=0 

取 负 指令 把 寄存 器 当 作 有 符号 整数 并 对 它 取 负 。16 位 寄存 器 存储 有 符号 整数 的 范围 
是 -32 768 到 32 767。 取 负 指 令 影响 N、Z 和 YV 位 ， 因 为 没有 对 应 的 正 值 32 768， 所 以 当 寄 
存 融 原始 值 是 -32768 时 ，YV 位 置 为 1。 取 负 指令 的 RTL 描述 是 
r——r; Ne r<0,Z<r=0, Ve {yw } 

fil 4.10 假定 要 执行 指令 的 十 六 进 制 表 示 是 18， 图 4-21 是 它 的 二 进 制 表示 。 操 作 码 表 


示 要 执行 按 位 取 反 指 令 ， 寄 存 器 -r 字段 表示 指令 将 作用 于 累加 器 。 指令 指示 符 1 
假定 累加 器 的 初始 内 容 是 0003 (hex)， 即 0000 0000 0000 0011 fo 0 011 0 ofo 
(bin)， 图 4-22 展示 了 执行 NOT 运算 的 结果 。NOT 运算 将 位 模式 变 1 8 


为 1111 1111 1111 1100， 如 果 把 它 看 作 有 符号 整数 ， 因 为 累加 需 的 数 图 4-21 按 位 取 反 指令 
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值 为 负 ， 所 以 N 位 为 1。 因为 累加 需 不 为 全 0， 所 以 Z 位 为 0。 
例 4.11 14-23 展示 了 取 负 指令 的 运算 ， 除 了 指令 指示 符 的 操作 码 1A 为 0001 101 外 


(表示 它 是 取 负 指令 》 初始 状态 和 例 4.10 一 样 。3 取 负 是 -3， 即 1111 1111 1111 1101 = 
FFFD (hex). 
Nz| | NZ| 10 | Nz| | nz | 10 | 
mine Ruimt 
a) 按 位 取 反 之 前 b) 按 位 取 反 之 后 a) 取 负 之 前 b) 取 负 之 后 
图 4-22 ” 按 位 取 反 指令 的 执行 图 4-23 取 负 指令 的 执行 


428 ” 装 入 字 节 和 存储 字 节 指令 


这 两 条 指令 和 接 下 来 的 两 条 都 是 字 节 指令 ， 字 节 指 令 是 对 单个 字 节 而 不 是 一 个 字 进 行 操 
作 。 装 和 人 字 节 指令 的 指令 操作 符 是 1101 raaa， 存 储 字 节 指 令 的 指令 操作 符 是 1111 raaa。 装 
入 字 节 指令 把 操作 数 装 入 累加 器 或 变 址 寄存 器 的 右 半 部 分 ， 影 响 N 和 Z 位， 保持 寄存 器 左 
半 部 分 不 变 。 存 储 字 节 指 令 把 累加 天 或 者 变 址 寄存 器 的 右 半 部 分 存储 到 一 个 单字 节 内 存单 
元 ， 不 影 啊 任何 状态 位 。 装 入 字 节 指令 的 RTL 描述 是 

r <8..15><— byte Oprnd; N «-r<0, Z<«-r=0 

存储 字 节 指令 的 RTL 描述 是 

byte Oprnd < r <8..15> 

例 4.12 ”假定 要 执行 指令 的 十 六 进 制 表示 是 D1004A， 图 4-24 是 它 的 二 进 制 表示 。 本 
例 中 寄存 器 -字段 是 0， 表 示 装 人 累加 占 而 不 是 变 址 寄存 器 。 寻 址 -aaa 字段 是 001， 表 示 
是 直接 寻 址 。 


指令 指示 符 操作 数 指示 符 
Opcode T 


ol or OOOOOOOD oo0000000| [0o1001010 


op pn 


假定 Mem[004A] 的 初始 内 容 是 92， 图 4-25 展示 了 执行 装 人 字 节 指令 后 的 结果 。 因 为 
累加 器 最 终 位 模式 的 符号 位 是 0， 所 以 N 位 为 0。 因为 位 模式 不 为 全 0， 所 以 Z 位 为 0。 O 


CPU Mem 
nz[__]} |L92 | pioo4A 
004A | 累加 占 装 人 字 节 





fe 
a) HAS HZ AT b) 装 入 字 节 之 后 
图 4-25 ” 取 负 指令 的 执行 
例 4.13 图 4-26 展示 了 执行 存储 字 节 指令 后 的 结果 。 除 了 指令 是 存储 字 节 而 不 是 装 


和信 字 节 外 ， 初 始 状态 和 例 4.12 一 样 。 累加 器 的 右 半 部 分 为 6D， 传 送 到 地 址 004A 的 内 


164 
i 
165 


Was 





a) 存储 字 市 之 前 b) 存储 字 节 之 后 
图 4-26 和 存储 字 市 指令 的 执行 


4.2.9 字符 输入 和 输出 指令 


字符 输入 指令 的 指令 指示 符 是 0100 laaa， 字 符 输 出 指令 的 指令 指示 符 是 0101 0aaa， 两 
者 都 是 字 节 指令 。 字 符 输入 指令 接收 来 自 输入 设备 的 下 一 个 ASCII 字符 ， 并 且 把 该 字符 相 
应 的 二 进 制 编 码 存储 在 主 存 的 一 个 字 节 中 。 字 符 输 出 指令 把 内 存 中 一 个 字 节 的 内 容 发 送 到 输 
出 设备 ， 输 出 设备 输出 相应 的 ASCII 字符 。 两 条 指令 对 CPU 中 任何 寄存 器 都 没有 影响 。 字 
符 输 入 指令 的 RTL 描述 是 

byte Oprnd 二 { 字符 输入 } 

字符 输出 指令 的 RTL 描述 是 

{ 字符 输出 } <— byte Oprnd 

例 4.14 假定 要 执行 指令 的 十 六 进 制 表示 是 49000A， 图 4-27 是 它 的 二 进 制 表 示 ， 没 
有 寄存 器 -r 字段 ， 寻 址 -aaa 字段 是 001， 表 示 是 直接 寻 址 。 


指令 指示 符 操作 数 指示 符 
Opcode 


moop | CRE ERE EE) 
图 4-27 字符 输入 指令 

假定 输入 流 的 下 一 个 字符 是 W， 图 4-28 
展示 了 执行 字符 输入 指令 后 的 结果 。 输 入 流 的 Pet CPU Mem i 
a ss 
值 57(hex) 发 送 到 地 址 004A 的 内 存单 元 。 een 

图 中 显示 CPU 中 没有 被 指令 影响 的 寄 
存 器 。 然 而 ，CPU 是 计算 机 系统 的 一 部 分 L | 





通过 它 发 送 到 总 线 的 控制 信号 控制 计算 机 的 。 FAAL b) 字符 输入 之 后 
其 他 部 分 。 从 CPU 到 输入 设备 的 虚线 表示 图 4-28 ”字符 输入 指令 的 执行 
控制 信号 ， 它 指 示 输 入 设备 把 输入 流 的 下 一 CPU ca Output CPU Mem Output 


个 字符 放 到 总 线 上 。 从 CPU 到 内 存 系统 的 51004A 
控制 信号 指示 内 存 子 系统 把 总 线 上 的 数据 存 字符 输出 


和 内存 单元。 控制 信号 包括 内 存 系统 存储 数 人 


所 的 地 址 信息 es 


容 是 48 (Hex) 图 4-29 展示 了 执行 字符 输 图 4.29 Eee 
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出 指令 后 的 结果 。CPU 给 内 存 系统 发 送 控制 信号 ， 让 它 把 内 存单 元 004A 的 数据 发 送 到 总 线 
E; 给 输出 设备 发 送 控制 信号 ， 让 它 从 总 线 上 获取 数据 ， 把 它 当 作 ASCII 字符 并 在 输出 设备 
上 输出 ，48 (hex) 对 应 的 ASCI 字符 是 字母 H。 go 


43 3+ WZH 


在 最 早期 的 电子 计算 机 中 ， 每 个 程序 都 是 手工 接线 的 。 要 改变 程序 ， 线 路 必须 要 手工 重 
连 ， 这 是 单调 又 耗 时 的 过 程 。3.1 节 中 描述 的 ENIAC 计算 机 就 是 这 种 计算 机 ， 它 的 内 存 仅仅 
用 来 存储 数据 。 

1945 年 ， 约 翰 . 汉 ' 诺 依 曼 在 宾夕法尼亚 大 学 的 一 份 报告 中 提议 美国 军械 部 建造 一 台 
在 主 存 中 可 以 存储 数据 也 可 以 存储 程序 的 计算 机 。 那 时 ， 存 储 程序 是 一 个 相当 激进 的 理念 。 
1949 年 ，Maurice V. Wilkes 在 剑桥 大 学 建造 了 电子 延迟 存储 自动 计算 问 (EDSAC)， 这 是 用 
冯 “ 诺 依 曼 的 存储 程序 理念 建造 的 第 一 人 台 计 算 机 。 实 际 上 , 今天 所 有 的 商用 计算 机 都 是 基于 
存储 程序 概念 ， 程 序 和 数据 共享 主 存 。 尽 管 有 人 认为 J. Presper Eckert Æ- - KEW XK 
发 表 的 前 几 年 就 提出 这 个 概念 ， 但 是 这 种 计算 机 还 是 被 称 作 冯 ， 诺 依 曼 计算 机 。 


4.3.1 BH: 诺 依 曼 执行 周期 
Pep/8 计算 机 是 一 个 典型 的 汉 “' 庄 依 曼 计算 机 。 图 4-30 是 执行 一 个 程序 所 需 步 又 的 伪 代 


码 描述 : 
这 个 do 循环 称 作 汉 “' 诺 依 曼 执行 周期 ， 一 个 周期 | Ee E 


初始 化 PC 和 SP 





包括 5 个 操作 do { 

e 取 指 取 下 一 条 指令 

指令 指示 符 解码 
o $45 递增 PC 
e 增加 PC 执行 取出 的 指令 
4— } 

e 执行 while (没有 执行 停止 指令 ) 

e 重复 

1: 诺 依 曼 周 期 固化 在 中 央 处 理 单元 中 ,下面 是 执 图 4-30 在 Pep/8 计算 机 上 执行 程序 
行 过 程 中 详细 步 又 的 描述 。 RA ROA 


为 了 把 机 器 语言 程序 装 和 人 主 存 ， 第 一 条 指令 要 放 在 地 址 0000 (hex)。 第 二 条 指令 放 在 与 
第 一 条 相 邻 的 地 址 。 如 果 第 一 条 指令 是 一 元 的 ， 那 么 第 二 条 指令 的 地 址 是 0001 ; 否则 第 一 
条 指令 的 操作 数 指 示 符 会 放 在 地 址 0001 和 0002 的 字 节 ， 那 么 第 二 条 指令 的 地 址 将 是 0003。 
类 似 地 ， 第 三 条 指令 放 在 与 第 二 条 相 邻 的 地 址 ， 整 个 机 器 语言 程序 就 是 这 样 装载 到 内 存 的 。 

为 了 初始 化 程序 计数 器 和 栈 指 针 ，PC 置 为 0000 (hex), SP 置 为 Mem[FFF8]。 程 序 计 数 
器 的 目的 是 保存 下 一 条 要 执行 指令 的 地 址 。 因 为 第 一 条 指令 装 人 内 存 的 地 址 是 0000， 所 以 
PC 必须 要 初始 化 为 0000。 栈 指针 的 目的 是 保存 运行 时 栈 顶 部 的 地 址 。 后 面 将 解释 SP 为 何 
设置 为 Mem[FFF8]。 

冯 ，. 诺 依 曼 执行 周期 的 第 一 个 操作 是 取 指 令 。 要 获取 一 条 指令 ，CPU 检测 PC 中 的 16 
位 ， 把 它 当 作 一 个 地 址 ， 到 主 存 的 这 个 地 址 获取 下 一 条 指令 的 指令 指示 符 (1 字 节 )。 把 指 
令 指 示 符 的 8 位 带 和 人 CPU ， 放 到 指令 寄存 器 CIR) 的 第 一 个 字 节 。 

- 诺 依 曼 执行 周期 的 第 二 个 操作 是 译 码 。CPU 从 指令 指示 符 中 提取 操作 码 ， 确 定 要 
执行 哪 条 指令 。 根 据 操作 码 ， 如 果 有 的 话 ， 就 提取 寄存 器 指示 符 和 寻 址 字段 。CPU 根据 操 
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作 码 就 能 知道 指令 是 不 是 一 元 的 ， 如 果 不 是 一 元 指令 ， 那 么 就 从 内 存 获取 操作 数 指示 符 〈 一 


个 字 )， 把 它 存储 在 IR 的 最 后 两 个 字 节 。 


冯 ， 诺 依 曼 执行 周期 的 第 三 个 操作 是 增加 PC。 如 果 指 令 是 一 元 指令 ，CPU 对 PC 加 1， 
否则 加 0003。 不 管 PC 加 哪个 数 ， 相 加 后 的 值 都 是 下 一 条 指令 的 地 址 ， 因 为 在 主 存 中 指令 是 


相 邻 的 。 

Th + 详 依 曼 执行 周期 的 第 四 个 操作 是 执 
行 。CPU 执行 存储 在 IR 中 的 指令 ， 操 作 码 告 
VE CPU 执行 39 条 指令 中 的 哪 一 条 。 

冯 ， 庄 依 坚 执 行 周期 的 第 五 个 操作 是 重 
复 。 除 非 刚 刚 执 行 的 指令 是 停止 指令 ， 否 则 
CPU 返回 到 取 指 令 操 作 。 如 果 指 令 试 图 执行 
一 个 非法 操作 ，Pep/8 也 将 在 此 时 终止 。 有 
些 指令 不 允许 使 用 特定 的 寻 址 方式 。 使 Pep/8 
终止 的 最 常见 的 非法 操作 是 试图 以 禁止 的 寻 
址 方式 执行 指令 。 

图 4-31 是 在 Pep/8 计算 机 上 执行 一 个 程 
序 所 需 步 又 的 详细 伪 代 码 描述 。 


4.3.2 一 个 字符 输出 程序 


图 4-31 


把 机 器 语言 程序 加 载 到 地 址 0000 开 始 的 内 存 
PC<-0000 
SP<-MemL[FFF8] 
do { 
取 PC 内 容 为 地 址 处 的 指令 指示 符 
PC<PC+]1 
指令 指示 符 解 码 


if (指令 不 是 一 元 的 ) 
取 PC 内 容 为 地 址 处 的 指令 指示 符 
PC<-PC+2 
} 
执行 取出 的 指令 
} 
while (没有 执行 停止 指令 && 指 令 是 合法 的 ) 


在 Pep/8 计算 机 上 执行 程序 所 需 步骤 的 
更 详细 伪 代 码 描述 





Pep/8 系统 可 以 从 键盘 输入 ， 输 出 到 屏幕 。 这 些 IO 设备 都 是 基于 ASCII 字符 集 的 。 当 你 
按 下 一 个 键 ， 代 表 1 个 ASCI 字符 的 1 个 字 节 的 信息 从 键盘 沿 着 总 线 传 送 到 主 存 。 当 CPU 党 
着 总 线 把 1 个 字 节 发 送 到 屏幕 时 ， 屏 幕 把 这 个 字 节 当 作 一 个 ASCII 字符 ， 显 示 该 字符 。 

在 ISA3 层 ， 机 器 层 ， 计 算 机 通常 只 有 字 节 类 型 的 输入 和 输出 指令 。 对 字 节 的 解释 发 生 在 
输入 和 输出 设备 ， 而 不 在 主 存 中 。Pep/8 唯一 的 输入 指令 是 把 1 个 字 节 从 输入 设备 传送 到 主 存 ， 


唯一 的 输出 指令 把 1 字 节 从 主 存 传送 到 输出 设备 。 
所 以 Pep/8 系统 在 ISA3 层 的 VO 称 作 字符 IO. 

图 4-32 展示 了 一 个 简单 的 机 器 语言 程序 ， 它 
在 输出 设备 上 输出 字符 Hi。 它 使 用 了 两 条 指令 : 
字符 输出 指令 0101 0 和 停止 指令 0000 0000。 
第 一 段 代 码 展 示 的 是 二 进 制 机 器 语言 程序 ， 主 存 
存储 这 些 1 和 0 的 序列 。 第 一 列 是 每 行 上 位 模式 
第 一 个 字 节 的 十 六 进 制 地 址 。 

第 二 段 代 码 展 示 了 同一 个 程序 的 十 六 进 制 简 
写 。 尽 管 这 个 格式 稍微 易 读 一 点 儿 ， 但 是 你 要 说 记 
内 存 存 储 的 是 位 ， 而 不 是 代码 中 那样 的 字面 上 的 
十 六 进 制 字符 。 第 二 段 代码 的 每 行 都 有 注释 ， 用 分 
号 与 机 器 语言 隔 开 。 注 释 不 会 随 程序 装 和 内存 。 

图 4-33 展示 了 计算 机 执行 这 个 程序 的 每 一 
步 。 图 4-33a 是 Pep/8 计算 机 的 初始 状态 ， 图 中 
没有 显示 输入 设备 ， 也 省 略 了 几 个 程序 用 不 到 的 


因为 通常 会 把 这 些 字 节 解 读 成 ASCI 字符 ， 


0101 0001 0000 0000 0000 0111 
0101 0001 0000 0000 0000 1000 
0000 0000 
0100 1000 
0110 1001 


机 器 语言 (hex ) 


510007 ;Character output 
510008 ;Character output 
;Stop 
;ASCII H character 
;ASCII 4 character 





图 4-32 ”输出 字符 Hi 的 机 器 语言 程序 


HAF FHEMAKABHY Il 


CPU affair, tN IAS Hen 4 位。 初始 时 ， 主 存单 元 和 CPU 寄存 硕 的 内 容 是 未 知 的 。 


Mem 
CPU 


999999 





Mem 


wo 








GPU 


pc [Ga 





510007 


=e 
PC 


510008 


CPU 


PC| 0006 | 


r [5100s ] 





i) 执行 。 把 字符 i 传送 到 输出 设备 













PC | 277? | 


f) 执行 。 把 字符 H 送 到 输出 设备 
Mem 






0000 


= 0003 
rc | 61 00 | ouput 





0007 
mlao] | coos [os | | 


Mem 
0000 | 510007 


= 0003 
Pc 


r [oor] 








图 4-33 Al 4-32 所 示 程 序 的 汉 ，… 诺 依 曼 执 行 周期 


112. PARQ HERRE (RIZA) 


Mem 


0000 | 510007 


CPU 0003 | 510008 


Output PC} 0007 we Output 


0007 
Loo? | ooosto [| | 





k) 增加 PC 1) 执行 。 机 器 停止 
图 4-33 ( 续 ) 


图 4-33b 是 过 程 的 第 一 步 。 程 序 装 人 主 存 ， 起 始 地 址 是 0000。 程 序 来 自 哪里 和 什么 把 
它 放 人 的 内 存 ， 这 些 细节 将 在 后 面 的 章节 描述 。 

图 4-33c 是 过 程 的 第 二 步 。 程 序 计 数 器 清空 置 为 0000 (hex)， 图 中 没有 显示 对 SP 的 初 
始 化 ， 因 为 这 个 程序 不 会 用 到 栈 指针 。 

图 4-33d 是 执行 周期 的 取 指 令 部 分 。CPU 检测 到 PC 中 的 位 为 0000 (hex), RECRE 
存 发 信号 让 主 存 把 这 个 地 址 的 字 节 发 送 到 CPU。 当 CPU 获得 这 个 字 节 时 ， 把 它 填 人 指令 寄 
存 器 的 第 一 部 分 。 接 着 CPU 对 指令 指示 符 解 码 ， 根 据 操作 码 确 定 指令 不 是 一 元 指令 ， 于 是 
把 操作 数 指示 符 也 读 人 IR。 取 指令 不 会 改变 地 址 0000、0001 和 0002 的 内 容 ， 主 存 只 是 把 
这 24 位 的 内 容 发 送 到 CPU. 

图 4-33e 显示 执行 周期 的 增加 部 分 ，CPU 给 PC 加 上 0003。 

图 4-33f 显示 执行 周期 的 执行 部 分 ，CPU 检测 到 IR 的 前 5 位 为 0101 0， 此 操作 码 给 电 
路 发 信和 号， 执行 字符 输出 指令 。 

根据 IR 的 内 容 ，CPU 检测 到 寻 址 方式 位 是 001， 这 表示 直接 寻 址 。 接 着 CPU 检测 操作 
数 指示 符 ， 其 内 容 为 0007 ( hex)， 于 是 给 主 存 发 送 控 制 信号 ， 直 接 走 到 地 址 0007， 把 这 个 
地 址 的 字 节 放 到 总 线 上 。 同 时 CPU 给 输出 设备 发 送 控制 信号 让 它 从 总 线 获取 这 个 字 节 。 输 
出 设备 把 这 个 字 节 解释 为 ASCII 字符 并 显示 它 。 如 果 寻 址 方式 不 是 直接 寻 址 ， ABA CPU 不 
会 给 主 存 发 信号 直接 去 地 址 0007 获取 字 节 。 

图 4-33g 显示 执行 周期 的 取 指 令 部 分 。 这 次 CPU 检测 到 PC 里 的 内 容 为 0003 (hex), F 
是 它 取出 地 址 0003 处 的 一 个 字 节 的 内 容 ， 发 现 指令 不 是 一 元 指令 ， 接 着 获取 在 地 址 0004 处 
的 一 个 字 ， 这 样 做 的 结果 是 改变 了 IR 的 原始 内 容 。 

图 4-33h 是 执行 周期 的 PC 增加 部 分 ，CPU 给 PC 加 0003 得 到 0006 (hex)。 

图 4-33i 显示 执行 周期 的 执行 部 分 。 与 图 4-33f 一样 ，CPU 发 现 操 作 码 是 字符 输出 指令 ， 
寻 址 方式 位 表明 是 直接 寻 址 。 但 是 ， 这 次 操作 数 指示 符 是 0008 ( hex)， 地 址 0008 处 的 字 市 
是 69 (hex)， 也 就 是 0110 1001 (bin)。 因 为 最 右 7 位 是 110 1001， 所 以 输出 设备 显示 ASCII 
字符 io 

图 4-33j 显示 执行 周期 的 取 指 部 分 ， 因 为 PC 包含 0006 (hex)， 所 以 这 个 地 址 的 字 节 来 到 
CPU。 这 次 当 CPU 检测 操作 码 时 ， 发 现 指 令 是 一 元 指令 ， 因 此 CPU 不 会 获取 地 址 0007 WF. 

图 4-33k 显示 执行 周期 的 PC 增加 部 分 ，CPU 给 PC 加 0001 得 到 0007。 

图 4-331 显示 执行 周期 的 执行 部 分 。 这 次 CPU 发 现 IR 中 操作 码 是 停止 指令 ， 因 此 它 忽 
略 寻 址 方式 而 只 是 停止 执行 周期 。 

仅仅 输出 两 个 字符 看 上 去 都 是 有 点 儿 复杂 的 过 程 ， 但 对 于 人 类 来 说 它 执行 得 相当 快 ， 许 
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多 计算 机 的 执行 周期 取 指 部 分 只 需 大 约 不 到 1 纳 秒 的 时 间 。 因 为 执行 周期 的 执行 部 分 取决 于 
指令 的 类 型 ， 因 此 执行 复杂 的 指令 可 能 需要 很 多 纳 秒 ， 而 执行 简单 的 指令 只 需要 几 个 纳 秒 的 
时 间 。 

计算 机 不 会 给 它 电 路 中 的 电子 信号 附加 任何 含义 。 具 体 来 说 ， 主 存 不 知道 一 个 特定 地 址 
的 位 是 代表 数据 还 是 指令 ， 它 只 知道 是 1 和 0。 


4.3.3 2B - 诺 依 曼 漏 洞 


在 图 4-32 的 程序 中 ， 地 址 0000 到 0006 的 位 被 CPU 作为 指令 ，0007 和 0008 的 位 作 
为 数据 。 因 为 程序 员 知 道 PC 的 初始 值 是 0000， 在 每 一 个 执行 周期 的 循环 会 被 加 0001 或 
0003， 所 以 他 把 指令 位 放 在 开头 。 如 果 犯 错 遗 漏 了 停止 指令 (操作 码 0000 0000 )， 尽 管 程序 
员 的 本 意 是 想 要 把 下 面 的 字 节 当 作 数据 ， 但 执行 周期 将 会 继续 获取 下 面 的 字 节 ， 把 它 当 作 下 

因为 程序 和 数据 共享 内 存 ， 所 以 机 器 层 程序 员 在 为 它们 分 配 内 存 时 必须 要 小 心 仔 细 ， 
否则 会 出 现 两 种 类 型 的 问题 : 一 种 是 CPU 可 能 会 把 程序 员 想 作 为 数据 的 位 序列 当 作 指令 ， 
另 一 种 是 CPU 把 程序 员 想 作为 指令 的 位 序列 当 作 数据 。 这 两 种 类 型 的 漏洞 都 发 生 在 机 
器 层 。 

虽然 如 果 程 序 员 不 仔细 ， 程 序 和 数据 共享 内 存 会 产生 漏洞 ， 但 是 这 也 带 来 了 令 人 激动 的 
潜在 价值 。 程 序 只 是 存储 在 内 存 中 的 一 组 指令 ， 因 此 程序 员 可 以 把 一 个 程序 看 作 另 一 个 程序 
的 数据 。 这 使 得 写 一 个 用 于 处 理 另 一 个 程序 的 程序 成 为 可 能 。 编 译 程序 、 汇 编程 序 和 装载 器 
采用 的 都 是 把 其 他 程序 当 作 数据 这 一 观点 。 


4.3.4 ”一 个 字符 输入 程序 地 址 机 器 语言 (bin ) 
0100 1001 0000 0000 0000 1101 

图 4-34 的 程序 从 输入 设备 输入 两 个 字符 ， 0100 1001 0000 0000 0000 1110 
A LM hx A pe 0101 0001 0000 0000 0000 1110 
以 逆序 在 输出 设备 输出 。 使 用 下 搂 寻 址 方式 的 字 0101 0001 0000 0000 0000 1101 
符 输 入 指令 从 输入 设备 获得 字符 。 0000 0000 

第 一 条 指令 49000D 的 操作 码 指明 是 字符 输 机 器 语言 ( hex ) 
人 指令 ， 寻 址 方式 位 指明 是 直接 寻 址 。 它 把 来 目 49000D ;Character input 
输入 设备 的 第 一 个 字符 放 入 位 于 Mem[000D] 的 ee 

Zi ; ra r 

字 节 。 虽 然 这 个 字 节 在 代码 中 没有 显示 ， 但 是 它 STOOD. Character gibi 
显然 是 有 效 地 址 ， 因 为 内 存 地 址 一 直到 FFFF。 00 ;Stop 


第 二 条 指令 49000E 也 是 字符 输入 指令 ， 但 是 把 
字符 放 入 到 Mem[000E]。 

第 三 条 指令 51000E 的 操作 码 指明 是 字符 输 
出 指令 ， 要 输出 存储 在 Mem[000E] 处 的 字 节 。 
第 四 条 指令 51000D 输出 存储 在 Mem[000D] 的 图 4-34 一 个 输入 2 个 字符 并 按照 逆序 输出 的 
FH o 机 器 语言 程序 
4.3.5 十进制 转换 为 ASCI 


图 4-35 展示 了 一 个 程序 ， 它 把 两 个 个 位 数字 相 加 ， 输 出 它们 一 位 数 的 和 。 这 个 程序 说 
明 在 机 器 层 处 理 输出 的 不 便 性 。 
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两 个 加 数 是 5 和 3， 程 序 把 它们 存储 在 Mem[0011] 和 Mem[0013]。 第 一 条 指令 把 5 装 
和 累加 器 ， 接 着 第 二 条 指令 把 累加 器 加 3， 此 时 和 在 累加 器 里 。 


现在 问题 出 现 了 。 我 们 想 输出 这 个 结果 ， 
但 是 ISA3 层 唯 一 的 输出 指令 是 字符 输出 指 
令 。 问 题 是 结果 为 0000 1000 (bin)， 如 果 字 
符 输 出 指令 输出 它 ， 会 把 它 当 作 退 格 键 BS， 
如 图 3-24 的 ASCII 表 所 示 。 

因此 ， 程序 必须 把 十 进 制 数 8， 即 0000 
1000 (bin)， 转 换 为 ASCI 字 符 8， 即 0011 
1000(bin)。ASCII 位 与 无 符号 二 进 制 位 不 同 ， 


1100 
0111 
1010 
111 
0101 
0000 
0000 
0000 
0000 
0000 


0001 
0001 
0001 
0001 
0001 
0000 
0000 
0000 
0000 
0000 


0000 0000 
0000 0000 
0000 0000 
0000 0000 
0000 0000 


0000 
0000 
0011 


0001 0001 
0001 0011 
0001 0101 
0001 0000 
0001 0000 


它 在 第 三 和 第 四 位 有 两 个 1。 为 了 实现 这 个 
转换 ， 程 序 用 寄存 器 OR 指令 将 累加 器 和 拓 
码 0000 0000 0011 0000 进行 或 运算 ， 在 结果 
中 插入 两 个 额外 的 1: 


0000 0000 0000 1000 
OR 0000 0000 0011 0000 


0000 0000 0011 1000 


现在 累加 器 包含 ASCII 格式 的 正确 的 和 ， 
存储 字 节 指令 把 这 个 字符 存储 在 Mem[0010]， 
然后 字符 输出 指令 输出 它 。 

如 果 把 Mem[0013] 的 字 蔡 换 为 0009， 那 
么 程序 会 输出 什么 ? 尽管 累加 颖 中 的 和 在 执 
行 加 法 累加 指令 后 是 

14 (dec) = 0000 0000 0000 1110 (bin) 

但 遗憾 的 是 ， 它 不 会 输出 14。OR 指令 会 把 这 个 位 模式 变 为 0000 0000 0011 1110 (bin), 
产生 的 输出 是 >。 因为 ISA3 层 唯 一 的 输出 指令 只 能 输出 单个 字 节 ， 所 以 程序 不 能 输出 包含 
大 于 1 个 字符 的 结果 。 在 第 $ 章 中 ， 我 们 将 看 到 如 何 补 救 这 个 缺点 。 


一 个 修改 自身 的 程序 


图 4-36 ee SETS: 庄 依 曼 设计 原理 的 一 个 奇特 的 可 能 性 。 我 们 注意 到 这 个 程序 从 
0006 ~ 001B 和 图 4-35 的 从 0000 ~ 0015 是 一 样 的 ， 然 而 这 个 程序 在 开始 有 两 个 图 4-35 中 
没有 的 指令 。 因 为 指令 往 下 移 了 6 个 字 节 ， 所 以 它们 的 操作 数 指示 符 也 比 前 面 程序 的 大 了 6。 
除了 有 6 个 字 节 的 调整 外 ， 从 0006 开始 的 指令 会 重复 图 4-35 的 处 理 过 程 。 

机 器 语言 (bin ) 
1101 0001 0000 


1111 0001 0000 
1100 0001 0000 


机 器 语言 (hex ) 


C10011 
710013 
A10015 


;A := first number 

;Add the two numbers 
;Convert sum to character 
F10010 ;Store the character 
510010 ;Output the character 

00 ;Stop 

00 ;Character to output 

0005 ;Decimal 5 

0003 ;Decimal 3 

0030 ;Mask for ASCII char 





图 4-35 计算 5 加 上 3 并 把 结果 当 作 一 个 字符 输 


出 的 机 咒语 言 程序 


4.3.6 


0111 0001 0000 
1010 0001 0000 
1111 0001 0000 
0101 0001 0000 


一 个 修改 自身 的 机 器 语言 程序 ， 累 加 需 指 令 被 改 为 了 减法 指令 





图 4-36 
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0000 0000 
0000 0000 
0000 0000 0000 0101 
0000 0000 0000 0011 
0000 0000 0011 0000 
1000 0001 


机 器 语言 (hex ) 

D1001D ;Load byte accumulator 
;Store byte accumulator 
sA := first number 
;Add the two numbers 


;Convert sum to character 
;Store the character 
;Output the character 

;Stop 

;Character to output 
;Decimal 5 

;Decimal 3 

:Mask for ASCII char 

;Byte to modify instruction 





图 4-36 ( 续 ) 


尤其 是 ， 装 人 累加 器 指令 把 5 装 人 累加 器 ， 加 法 指令 对 累加 器 加 3，OR 指令 把 8 (dec) 
变 为 ASCII 的 8， 存 储 字 节 累 加 器 指令 把 8 放 入 Mem[0016]， 而 字符 输出 指令 输出 8。 但 
是 ， 输 出 却 是 2。 

因为 在 冯 “' 诺 依 曼 计算 机 中 程序 和 数据 共享 同一 个 内 存 ， 所 以 程序 有 可 能 把 它 自己 当 作 
数据 并 进行 修改 。 第 一 条 指令 把 字 节 81 (hex) 装 人 累加 器 的 右 半 部 分 ， 接 着 第 二 条 指令 把 
它 放 人 Mem[0009]。 在 这 个 修改 之 前 Mem[0009] 的 内 容 是 什么 ? 加 法 累加 器 指令 的 指令 指 
示 符 。 现 在 Mem[0009] 的 位 是 1000 0001。 当 计算 机 在 冯 … 诺 依 曼 执 行 周 期 的 取 指 部 分 得 到 
这 些 位 时 ，CPU 检测 到 操作 码 为 1000， 是 减法 寄存 髓 指令 ， 寄 存 器 指示 符 表 示 是 累加 器 ， 
寻 址 方式 位 显示 是 直接 寻 址 。 指 令 从 5 MA 3 而 不 是 加 3。 

当然 ， 这 并 不 是 一 个 非常 实际 的 程序 。 如 果 想 对 两 个 数 进行 减法 运算 ， 可 以 简单 地 用 减 
法 指令 代替 加 法 指令 ， 写 图 4-35 的 程序 就 可 以 了 。 但 是 它 确实 表明 在 冯 : 诺 依 曼 计 算 机 中 ， 
主 存 不 会 赋予 它 正在 存储 的 位 任何 含义 ， 它 只 知道 1 和 0， 并 不 知道 哪些 是 程序 位 、 哪 些 是 
数据 位 、 哪 些 是 ASCII 字 符 等 。 此 外 ，CPU 遵循 冯 ' 诺 依 曼 执行 周期 ， 相 应 地 解释 位 ， 并 
不 了 解 它们 的 历史 。 当 获取 在 Mem[0009] 的 位 时 ， 它 不 知道 也 不 在 意 这 些 位 是 怎么 样 到 这 
里 的 ， 它 只 是 简单 地 一 再 重复 取 指 、 译 码 、 增 加 PC 和 执行 。 


4.4 1SA3 层 编 程 


ISA3 层 编 程 就 是 写 二 进 制 指令 。 要 执行 二 进 制 序 列 ， 首 先 要 把 它 装 人 主 存 。 操 作 系 统 
负责 把 二 进 制 序 列 装 人 主 存 。 
操作 系统 就 是 一 个 程序 。 与 任何 其 他 程序 一 样 ， 软 件 工程 师 必 须 设 计 、 编 写 、 测 试 
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和 调试 操作 系统 。 大 多 数 操作 系统 非常 庞大 和 复杂 ， 必 须 由 一 个 工程 师 团 队 来 编写 。 操 
作 系 统 的 主要 功能 是 控制 应 用 程序 在 计算 机 上 的 执行 。 因 为 操 主 存 
作 系 统 本 身 也 是 一 个 程序 ， 所 以 要 执行 操作 系统 ， 它 也 必须 在 oa 
主 存 中 。 因 此 在 主 存 中 不 仅 要 存储 应 用 程序 ， 也 要 存储 操作 应 用 程序 
系统 。 FBCE 
在 Pep/8 计算 机 中 ， 主 存 的 底部 保留 给 操作 系统 ， 顶 部 保留 BCF 
给 应 用 程序 。 图 4-37 展示 了 操作 系统 在 主 存 中 的 位 置 ， 它 占用 从 
FBCF 开始 的 主 存 ， 剩 下 的 从 0000 到 FBCE 用 于 应 用 程序 。 
操作 系统 的 装载 器 (loader) 把 应 用 程序 装 人 主 存 ， 这 样 它 才 FFFF Fe 
能 执行 。 那 么 什么 来 装 人 装载 器 呢 ? Pep/8 的 装载 器 和 操作 系统 ys 4 4 pep/8 操作 系统 在 
的 许多 其 他 部 分 是 永久 存储 在 主 存 中 的 。 主 存 中 的 位 置 


约翰 15 - 诺 依 曼 

约翰 ， 冯 ， 诺 依 曼 是 一 个 伟大 的 数学 家 、 物 理学 家 、 带 辑 学 家 和 计算 机 科学 家 。 有 
关于 冯 ，。 诺 依 曼 非 凡 解 题 速 度 和 惊人 记忆 力 的 故事 一 直 在 流 
传 。 他 的 天 才 不 仅 用 于 深化 他 的 数学 理论 ， 还 用 于 记忆 整 本 
书 ， 在 读 过 数 年 之 后 仍 能够 背诵 出 来 。 但 是 如 果 你 问 高 速 公 
路 巡警 ， 他 准 会 绝望 地 举 起 双手 ; 在 开车 时 ， 这 位 数学 天 才 
就 跟 一 个 频道 的 青少年 一 — HF FF i 

1903 $, 4 -B-BRRAETATA, HR-TEH | 
犹太 银行 家 的 长 子 。 他 11 岁 时 进入 高 中 ， 不 久 后 他 的 数学 老 | 
师 建 议 由 大 学 教授 来 给 他 授课 。 他 年 仅 19 岁 时 ， 他 就 发 表 
了 他 的 第 一 篇 论文 ， 被 公认 为 杰出 的 数学 家 。 

在 第 二 次 世界 大 战 爆 发 之 前 ， 冯 “， ERZSF ROWE 
美国 。 战 争 期 间 ， 由 于 流体 力学 方面 的 知识 ， 冯 “' BRB 
雇 于 美国 军 方 和 相关 的 民用 机 构 作 为 顾问 。1943 年 ， 他 还 被 

要 求 参与 原子 弹 的 建设 。 因 为 这 份 工 作 ， 艾森豪威尔 总 统 在 1955 年 任命 他 加 入 原子 能 委 
员 会 

1944 年 一 次 偶然 的 机 会 他 遇 到 Herbert Goldstine， 第 一 代 可 运行 电子 数字 计算 机 的 先 
锋 ， 冯 ， 诺 依 曼 开 始 接触 计算 机 。 他 在 火车 站 与 Goldstine 偶然 的 谈话 点 燃 了 他 新 的 迷恋 。 
他 开始 研究 存储 程序 的 概念 ， 最 终 实现 了 在 计算 机 内 部 存储 程序 ， 消 除了 在 那个 时 代 对 计 
算 机 重新 编程 所 需要 的 宛 长 的 劳动 。 他 还 开发 出 了 新 的 计算 机 体系 结构 ， 基 于 现在 有 名 的 
芭 ， 诺 依 曼 周 期 来 执行 存储 的 任务 。 从 计算 机 发 明 最 初 到 现在 ,改变 的 主要 是 速度 和 基本 
电路 的 组 成 ， 而 冯 ， 诺 依 曼 设 计 出 的 基本 体系 结构 保持 至 今 

在 冯 ， 诺 依 曼 的 一 生 中 ， 他 在 很 多 知名 机 构 任 教 ， 包括 柏林 、 汉堡 和 普林斯顿 大 学 。 
在 普林斯顿 时 ， 他 与 天 才 的 但 当时 还 不 其 有 名 的 英国 学 生 Alan Turing 一 起 工作 。 他 还 获 
得 了 很 多 奖项 ， 包 括 普 林 斯 顿 、 哈 佛 和 伊斯坦布尔 大 学 的 荣誉 博士 。1957 F, Ze BK 
曼 由 于 骨 癌 在 华盛顿 特区 逝世 ， 时 年 S4 岁 。 

“在 你 都 不 知道 自己 在 说 什么 的 时 候 ， 精 确 是 没有 意义 的 。” 
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441 只 读 内 存 


这 里 有 两 种 制造 内 存 设备 的 电子 电路 元 件 一 一 读 / 写 电路 元 件 和 只 读 电 路 元 件 。 

在 图 4-36 的 程序 中 ， 当 执行 存储 字 节 指令 F10016 时 ，CPU 把 累加 器 右 半 部 分 的 内 容 
传送 到 到 Mem[0016], Mem[0016] 的 原始 内 容 被 破坏 ， 现 在 内 存单 元 内 容 为 0011 0010(bin)。 
当 接 下 来 执行 字符 输出 指令 时 ， 内 存单 元 0016 的 位 就 被 传送 到 了 输出 设备 。 

内 存单 元 0016 的 电路 元 件 是 读 / 写 电路 。 存 储 指令 对 它 进行 了 写 操 作 ， 使 它 的 内 容 
发 生 改 变 ， 字 符 输 出 指令 对 它 进 行 了 一 个 读 操作 ， 把 它 内 容 的 副本 发 送 到 输出 设备 。 如 果 
0016 的 电路 元 件 是 只 读 电 路 ， 那 么 存储 指令 不 会 改变 它 的 内 容 。 

相对 于 串 行 设备 ， 主 存 电 路 元 件 的 两 种 类 型 一 一 读 / 写 和 只 读 ， 都 是 随机 存 取 设备 。 当 
字符 输出 指令 对 内 存单 元 0016 进行 读 操 作 时 ， 它 不 需要 从 0000 开始 依 序 经 过 0001, 0002, 
0003 等 直到 0016， 它 直接 找到 位 置 0016。 因 为 它 能 直接 访问 主 存 的 任意 位 置 ， 所 以 这 种 电 
路 元 件 叫 作 随机 存 取 设 备 。 

只 读 内 存 设备 称 为 ROM。 读 / 写 内 存 设备 应 该 称 为 RWM， 遗 憾 的 是 ， CIRA RAM, 
表示 随机 存 取 内 存 。 很 遗憾 叫 这 个 名 字 ， 因 为 只 读 和 读 / 写 设备 都 是 随机 存 取 设备 。 区 别 只 
读 内 存 设备 和 读 / 写 内 存 设 备 的 特性 是 只 读 内 存 设备 的 内 容 不 能 被 存储 指令 改变 。 由 于 在 计 
算 机 工业 中 RAM 这 个 词 的 使 用 是 如 此 的 普遍 ， 所 以 我 们 也 用 它 来 指 代 读 / 写 内 存 设 备 , 但 
是 在 心里 ， 我 们 知道 ROM 也 是 随机 存 取 的 。 

主 存 中 通常 包含 一 些 ROM 设备 。 这 些 部 分 是 包含 永久 二 进 制 序列 的 ROM， 存 储 指令 
是 不 能 改变 的 。 此 外 ， 每 天 结束 时 关机 和 每 天 开始 时 开机 ， 这 些 二 进 制 序列 都 保持 在 ROM 
的 电路 中 。 如 果 关 机 ，RAM 不 会 保留 它 的 记忆 ， 因 此 它 又 称 为 易 失 的 (volatile)。 

计算 机 厂商 给 内 存 系 统购 买 ROM 有 两 种 方法 。 它 可 以 向 电路 厂商 指定 内 存 设备 中 希望 
的 位 序列 ， 然 后 电路 厂商 相应 地 生产 设备 ; 或 者 它 订购 可 编程 只 读 内 存 (PROM)。 这 是 一 
种 全 0 的 ROM，, 计算 机 厂商 可 以 把 任意 希望 的 位 置 永久 地 变 为 1。 用 这 样 的 方法 ， 设备 将 
包含 适当 的 位 序列 。 这 个 过 程 叫 作 “ 烧 人 ”位 模式 。 


4.4.2 Pep/8 操作 系统 


Pep/8 操作 系统 的 大 部 分 都 已 经 烧 人 人 ROM。 图 4-38 展示 了 操作 系统 的 ROM 部 分 ， 它 从 
FC57 开始 一 直到 FFFF， 这 部 分 主 存 是 永久 不 变 的 ， 存 储 指 令 不 能 改变 它 。 如 果 掉 电 ， 又 上 
电 ， 操 作 系 统 的 这 个 部 分 仍然 在 这 里 。 从 FBCF 到 FC56 的 
区 域 是 计算 机 操作 系统 的 RAM 部 分 。 

操作 系统 的 RAM 部 分 用 来 存储 系统 变量 。 当 操作 系 
统 程序 执行 时 ， 它 们 的 值 会 改变 。 操 作 系 统 的 ROM 部 分 
包含 装载 器 ， 它 是 永久 固定 的 。 它 的 工作 是 把 应 用 程序 装 
和信 从 地 址 0000 开始 的 RAM。 在 Pep/8 计算 机 上 ， 通 过 从 
模拟 顺 程 序 菜单 中 选择 装载 器 选项 来 调用 装载 器 。 

图 4-39 是 Pep/8 系统 一 个 更 详细 的 内 存 图 。 与 图 4-38 
一 样 ， 阴 影 区 域 代表 操作 系统 的 范围 ， 空 白 区 域 代 表 应 用 
程序 的 范围 。 

应 用 程序 的 运行 时 栈 叫 作用 户 栈 。 从 内 存单 元 
FBCF 开始 ， 正 好 在 操作 系统 的 上 面 。CPU 中 的 栈 指针 图 4-38 Pep/8 系统 中 的 只 读 存 储 器 
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寄存 器 存放 栈 顶 的 地 址 。 当 程序 被 调用 时 ， 会 在 栈 上 分 配 参数 、 返 回 地 址 和 局 部 变量 的 存 
储 空间 ， 从 较 低 的 地 址 开始 连续 分 配 ， 因 此 栈 在 内 存 中 是 “向 


Mem 
上 生长 的 ”。 0000 

操作 系统 的 运行 时 栈 从 内 存单 元 FC4F 开始 ， 它 位 于 用 户 栈 
起 始 往 下 128 字 节 的 位 置 。 当 操作 系统 执行 时 ，CPU 中 的 栈 指 
针 包 含 系 统 栈 顶 的 地 址 。 与 用 户 栈 一 样 ， 系 统 栈 在 内 存 中 也 是 
向 上 生长 的 。 操 作 系 统 的 栈 绝 不 会 超过 128 字 节 ， 因 此 系统 栈 
不 可 能 试图 把 它 的 数据 存储 在 用 户 栈 的 范围 内 。 

Pep/8 操作 系统 由 两 个 程序 组 成 一 一 开始 于 地 址 FC57 的 装 FBCF 
载 硕 和 开始 于 地 址 FC9B 的 陷阱 处 理 程序 。 看 图 4-6 你 会 记得 ， 

在 ISA3 层 操 作 码 从 0010 01 到 0100 0 的 指令 是 未 实现 的 ， 陷 阱 

处 理 程序 把 这 3 条 指令 实现 给 汇编 语言 程序 员 。 第 $ 章 会 讲述 

Asmb5 汇编 层 的 这 些 指令 ， 第 8 章 将 展示 在 OS4 操作 系统 层 是 
如 何 实现 它们 的 。 

与 操作 系统 这 两 个 部 分 相关 的 是 ROM 最 底部 的 4 个 字 ， 
它们 被 操作 系统 保留 为 特殊 用 途 ， 称 为 机 器 向 量 ， 地 址 分 别 是 
FFF8、FFFA、FFFC 和 FFFE， 如 图 4-39 Pita. FFF8 

当 从 Pep/8 模拟 器 菜单 选择 装 入 选项 上 时， 发生 了 下 列 两 个 FFFA 
事件 : 

SP 二 Mem[FFFA] 

em a. RI 4-39 ”Pep/8 系统 的 内 存 图 

换 句 话说 ， 内 存单 元 FFFA 的 内 容 被 复制 到 栈 指针 ， 内 存单 
元 FFFC 的 内 容 被 复制 到 程序 计数 器 。 这 两 个 事件 发 生 后 ， 执 行 周 期 开始 。 图 4-40 展示 了 
这 两 个 事件 。 





CPU CPU 
CPU 


SP | FC4F Mem SP Mem 
sp Men FFFA FFEA 
rc sve ii FFFc FFEC 


FFFC 
E 一 二 一 H 


a) 初始 状态 b) SP<-Mem[FFFC] c) PC <— Mem[FFFC] 
图 4-40 Pep/8 加 载 选 项 


实际 上 ， 选 择 装 入 选项 会 把 栈 指针 和 程序 计数 右 初 始 化 为 存储 在 FFFA 和 FFFC 中 的 预 
定 值 。 地 址 FFFA 的 值 正 好 是 系统 栈 的 底部 FC4F ， 也 就 是 系统 栈 为 空 时 栈 指针 的 值 。 而 地 
HE FFFC 的 值 正好 是 FC57， 它 是 装 入 器 中 要 执行 的 第 一 条 指令 的 地 址 。 

写 操作 系统 的 系统 程序 员 决 定 系统 栈 和 装载 右 应 该 在 什么 位 置 。 因 为 当选 择 装 入 选项 
时 ，Pep/8 计算 机 会 从 FFFA 和 FFFC 获取 疝 量 ， 系 统 程序 员 会 在 这 些 位 置 放置 适当 的 值 。 
由 于 执行 周期 的 第 一 步 是 取 指 令 ， 所 以 选择 装 人 选项 后 第 一 条 要 执行 的 指令 就 是 装载 器 的 第 
一 条 指令 。 
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如 果 想 修改 操作 系统 ， 装 载 器 不 从 FC57 开始 ， 假 定 从 7BD6 开始 ， 当 用 户 选择 装 和 人 选 
项 时 ， 计 算 机 仍 将 去 FFFC 获取 向 量 ， 因 此 需要 把 7BD6 放 在 地 址 FFFC 处 。 

这 种 在 特殊 保留 内 存单 元 中 存储 地 址 的 方案 具有 很 好 的 灵活 性 ， 它 允许 系统 程序 员 把 装 
载 器 放 在 内 存 中 任何 方便 的 位 置 。 一 个 更 直接 但 是 缺乏 灵活 性 的 方案 是 把 计算 机 设计 成 当 用 
户 选 择 装 入 选项 时 ， 执 行 下 列 操作 : 

SP +— FC4F 

PC +— FC57 

如 果 选 择 装 入 选项 会 产生 这 两 个 事件 ， 那 么 当前 操作 系统 的 装载 器 仍然 能 正确 工作 。 但 
是 修改 操作 系统 会 很 困难 。 装 载 右 不 得 不 总 是 从 FC57 开始 ， 系 统 栈 会 不 得 不 总 是 从 FC4F 
开始 ， 系 统 程序 员 不 能 选择 系统 各 个 部 分 的 放置 位 置 。 


4.4.3 ”使 用 Pep/8 系统 


为 了 在 Pep/8 计算 机 上 装 和 人 一 个 机 器 语言 程序 ， 所 幸 的 是 ， 不 一 定 非 要 用 二 进 制 来 编写 
这 个 机 器 语言 程序 ， 可 以 在 文本 文件 中 用 ASCII 十 六 进 制 字符 进行 编写 。 当 装载 器 装 人 这 
个 程序 时 会 把 它 从 ASCII 转换 到 二 进 制 。 sg 

_ 地 址 机 器 语言 (hex ) 

图 4-41 中 的 代码 展示 了 怎样 准备 一 个 机 天 语 0000 510007 ;Character output 
言 程序 以 便装 人 。 这 是 图 4-32 中 的 程序 ， 输 出 Hio | 0003 510008 ;Character output 
可 以 在 文本 文件 中 编写 十 六 进 制 形式 的 二 进 制 序 | OO ae 
列 , 不 需要 任何 地 址 或 注释 。 以 小 写 的 ZZ 结束 字 节 0008 ;ASCII i character 
INR, RAAB zz 作为 一 个 标记 符号 。 装 载 器 将 
把 这 些 字 节 逐 个 送 入 内 存 中 从 0000 Chex) 开始 的 地 
址 中 。 

Pep/8 装载 器 对 机 器 语言 程序 的 格式 是 非常 挑 | BE 
剔 的。 为 了 正确 地 工作 ， 文 本 文件 中 的 第 一 个 字符 E 
必须 是 十 六 进 制 字符 ， 开 头 不 允许 有 空 行 或 空格 ， 图 4-41 ”为 加 载 器 准备 程序 
字 节 之 间 必 须 有 且 只 能 有 一 个 空格 。 如 果 字 节 流 要 
从 新 的 一 行 开始 ， 上 一 行 的 结尾 一 定 不 能 有 空格 。 

在 编写 完 机 器 语言 程序 并 用 装载 器 选项 把 它 装 人 人 之后， 必须 选择 执行 选项 去 运行 它 。 当 
选择 执行 选项 时 ， 发 生 下 面 两 个 事件 : 

SP * 一 Mem[FFF8] 

PC +— 0000 

然后 冯 “ 诡 依 曼 执行 周期 开始 。 因 为 PC 的 值 是 0000， 所 以 CPU 将 从 Mem[0000] 处 获 
取 第 一 条 指令 ， 装 载 器 刚好 把 应 用 程序 的 第 一 条 指令 放 在 这 里 。 

图 4-39 表明 Mem[FFF8] 的 内 容 是 FBCF ， 这 是 用 户 栈 的 底部 。 本 例 中 的 应 用 程序 不 使 
用 运行 时 栈 。 如 果 应 用 程序 要 用 到 运行 时 栈 ， 因 为 SP 被 初始 化 为 用 户 栈 底部 的 地 址 ， 所 以 
程序 能 够 正确 地 存 取 栈 。 

好 好 享受 你 现在 学 到 的 知识 吧 ! 


加 载 器 的 十 六 进 制 版 本 
51 00 07 51 00 08 00 48 69 zz 


总 结 
几乎 所 有 的 商用 计算 机 都 是 基于 冯 “ 庄 依 曼 设 计 原 理 的 ， 这 个 原理 中 主 存 既 存储 数据 也 
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存储 指令 。 冯 … 诺 依 曼 机 器 的 4 个 组 成 部 分 是 输入 设备 、 中 央 处 理 单元 (CPU)、 主 存 和 输 
出 设备 。CPU 包含 一 组 寄存 器 ， 其 中 一 个 寄存 器 是 程序 计数 器 (PC)， 它 存储 下 一 条 要 执行 
指令 的 地 址 。 

CPU 有 一 组 固化 在 其 中 的 指令 集 。 一 条 指令 由 指令 指示 符 和 操作 数 指示 符 组 成 。 指 令 
指示 符 依 次 由 操作 码 、 可 能 有 的 寄存 器 字段 和 寻 址 方式 字段 组 成 。 操 作 码 用 来 确定 要 执行 指 
令 集中 的 哪 条 指令 ， 寄 存 需 字段 用 来 确定 哪个 寄存 器 参与 运算 ， 寻 址 方式 字段 用 来 确定 源 或 
目的 数据 使 用 哪 种 寻 址 方式 。 

每 种 寻 址 方式 对 应 于 一 种 操作 数 指示 符 (OprndSpec) 和 操作 数 (Oprnd) 之 间 的 关 
系 。 对 于 直接 寻 址 方式 ， 操 作 数 指示 符 是 主 存 中 操作 数 的 地 址 ， 数 学 表示 为 : Oprnd = 
Mem[OprndSpec]。 

要 执行 一 个 程序 ， 需 要 把 一 组 指令 和 数据 装 入 主 存 ， 然 后 汉 … 诺 依 曼 执 行 周期 开始 。 
冯 ， 庄 依 曼 执行 周期 由 下 列 步骤 组 成 : 1 ) 获取 PC 指定 的 指令 ; 2) 对 指令 指示 符 译 码 ; 
3) 增加 PC; 4) 执行 取出 的 指令 ;5 ) 返回 第 一 步 重 复 进行 。 

由 于 主 存 既 存 储 指令 也 存储 数据 ， 所 以 在 机 器 层 有 可 能 出 现 两 种 类 型 的 问题 。 可 以 把 数 
据 位 解释 为 指令 ， 或 者 可 以 把 指令 位 解释 成 数据 。 此 外 还 有 一 种 可 能 性 ， 把 指令 存储 在 主 存 
中 的 直接 后 果 是 可 以 像 处 理 数 据 一 样 处 理 程序 。 装 载 器 和 编译 程序 是 使 用 把 指令 位 当 作 数据 
这 一 观点 的 重要 程序 。 

操作 系统 是 控制 应 用 程序 执行 的 一 个 程序 ， 它 必须 与 应 用 程序 和 数据 一 起 位 于 主 存 中 。 
在 某 些 计算 机 中 ， 操 作 系 统 的 一 部 分 烧 入 只 读 内 存 (ROM) 中 。ROM 的 一 个 特性 是 存储 指 
令 改变 不 了 内 存单 元 的 内 容 。 操 作 系 统 的 运行 时 栈 位 于 随机 存储 内 存 (RAM) 中 。 机 器 向 量 
是 操作 系统 组 成 部 分 的 地 址 ， 例 如 栈 或 者 程序 ， 它 用 于 存 取 这 个 组 成 部 分 。 装 载 器 和 陷阱 处 
理 程序 是 操作 系统 的 两 个 重要 功能 单元 。 


练习 


41% 
*1. (a) Pep/8 计算 机 的 主 存 有 多 少 字 节 ? (b) 有 多 少 个 字 ? (c) 有 多 少 位 ? (d) Pep/8 的 CPU 中 总 共有 
多 少 位 ? (e) 以 位 来 度量 ， 主 存 比 CPU 大 多 少 倍 ? 
2. (a) 假定 Pep/8 的 主 存 全 都 是 一 元 指令 ， 那 么 包含 多 少 一 元 指令 ? (b) 如 果 所 有 指令 都 不 是 一 元 指 
令 ， 能 容纳 多 少 指令 ?〈c) 假定 主 存 中 全 是 一 元 和 非 一 元 指令 ， 它们 的 数量 相同 ， 那 么 总 共 能 容纳 
多 少 指令 ? 
*3. 回答 有 关机 器 语言 指令 7AF82C Al D623D0 的 下 列 问 题 。( a) 二 进 制 表 示 的 操作 码 是 什么 ?(b) 指 
令 是 做 什么 的 ?(c) 二 进 制 表示 的 寄存 器 -r FREMA? (d) 它 指 定 的 是 哪 一 个 寄存 器 ? (e) 二 进 
制 表示 的 寻 址 方式 字段 是 什么 ? (f) 它 指定 的 是 哪 种 寻 址 方式 ?( g) 十 六 进 制 表示 的 操作 数 指示 符 
是 什么 ? 
4. 对 于 机 器 语言 指令 8B00AC 和 F70BD3， 回 答 练习 3 中 的 问题 。 


4.2% 

*5. 假定 Pep/8 包含 下 列 4 个 十 六 进 制 值 : 
A: 19AC 
X: FE20 


Mem[0A3F]: FF00 
Mem[0A41]: 103D 
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如 果 下 列 每 条 语句 执行 前 是 这 4 个 值 ， 那 么 每 条 语句 执行 后 4 个 十 六 进 制 值 是 什么 ? 
(a) ClO0A3F (b) DIOA3F (c) D90A41 (d) F10A41 (e) E90A3F 


(f) 890A41 (g) 810A3F (h) A10A3F (i) 19 
6. 对 下 列 语句 重复 练习 5: 
(a) C90A3F (b) D90A3F (c) F10A41 (d) E10A41 (e) 790A3F 
(f£) 810A41 . (g) 990A3F (h) A90A3F (i) 18 
4.3 节 


*7. 确定 下 列 Pep/8 机 融 语 言 程序 的 输出 ， 左 边 一 列 是 本 行 第 一 个 字 节 的 内 存 地 址 : 
0000 51000A 
0003 51000B 
0006 51000C 
0009 00 
000A 4A6F 
000C 79 


8. 如 果 输 入 是 tab ， 确 定 下 列 Pep/8 机 器 语言 程序 的 输出 ， 左 边 一 列 是 本 行 第 一 个 字 节 的 内 存 地 址 : 
0000 490010 
0003 490011 
0006 490012 
0009 510011 
000C 510010 
OOOF OO 


9. 确定 下 列 Pep/8 机 器 语言 程序 的 输出 ， 每 部 分 左边 一 列 是 本 行 第 一 个 字 节 的 内 存 地 址 : 
* (a) (b) 


0000 C1000E 0000 C1000C 
0003 910010 0003 18 
0006 F1000D 0004 F1000B 
0009 51000D 0007 51000B 
000C 00 000A 00 
000D 00 000B 00 
000E A94F 000C FOD4 
0010 FFFD 

4.4 节 


10. 假定 需要 处 理 Pep/8 内 存 中 的 31 000 个 整数 ， 每 个 整数 占用 一 个 字 。 一 个 典型 的 程序 中 估计 有 
20% 的 指令 是 一 元 指令 ， 那么 在 这 个 处 理 数 据 的 程序 中 最 多 能 有 多 少 条 指令 ? 要 记 住 应 用 程序 是 
与 操作 系统 和 数据 共享 内 存 的 。 

11.(a) 你 正在 用 的 计算 机 是 哪 家 公司 制造 的 ? (b) 它 的 主 存 是 多 少 字 节 ? (c) 它 的 CPU 中 有 多 少 寄 存 
an? 每 个 寄存 器 是 多 少 位 的 ? (d) 一 条 指令 包含 多 少 位 ? (e) 指令 中 有 多 少 位 留 做 操作 码 使 用 ? 


问题 

4.4 节 

12. 写 一 个 在 输出 设备 上 输出 你 名 字 的 机 器 语言 程序 ， 它 的 格式 要 适合 Pep/8 模拟 器 的 装载 器 并 能 够 在 
上 面 执行 。 

13. 写 一 个 在 输出 设备 上 输出 4 个 字符 Frog 的 机 器 语言 程序 ， 它 的 格式 要 适合 Pep/8 模拟 器 的 装载 器 
并 能 够 在 上 面 执行 。 

14. 写 一 个 在 输出 设备 上 输出 3 个 字符 Cat 的 机 器 语言 程序 ， 它 的 格式 要 适合 Pep/8 模拟 器 的 装载 器 
并 能 够 在 上 面 执行 。 

15. 写 一 个 把 3 个 数 2、-3 和 6 相 加 的 机 器 语言 程序 ， 在 输出 设备 上 输出 和 ， 它 的 格式 要 适合 Pep/8 模 
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拟 器 的 装载 器 并 能 够 在 上 面 执行 。 以 十 六 进 制 存 储 -3。 不 要 使 用 减法 、 取 反 或 反 转 指令 。 

16. 写 一 个 输入 2 个 1 位 数 ， 把 它们 相 加 ， 并 输出 1 个 1 位 数 和 ， 它 的 格式 要 适合 Pep/8 模拟 器 的 装载 
器 并 能 够 在 上 面 执行 。 

17. 以 十 六 进 制 格式 编写 图 4-35 的 程序 用 来 输入 到 装载 器 。 在 Pep/8 模拟 器 上 运行 它 ， 验 证 它 可 以 正 
确 地 工作 。 然 后 修改 字 节 存储 指令 和 字符 输出 指令 ， 把 结果 存储 在 Mem[FCF5]， 再 从 Mem[FCF5] 
输出 字符 ， 输 出 是 什么 ? 请 解释 。 
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ISA3 层 的 语言 是 机 器 语言 ， 是 1 和 0 的 序列 ， 有 时 简写 为 十 六 进 制 的 格式 。 计 算 机 的 
先驱 不 得 不 使 用 机 器 语言 编程 ， 但 是 很 快 他 们 就 开始 厌恶 这 种 很 土 的 方式 。 要 记 住 机 器 的 操 
作 人 码 ， 不 得 不 频繁 地 查 ASCI 表 和 十 六 进 制 表 ， 这 些 都 毫 无 趣味 。 发 明 汇 编 层 就 是 为 了 让 
程序 员 能 免 于 二 进 制 编程 的 单调 乏味 。 

第 4 章 讲述 ISA3 层 ， 也 就 是 机 器 层 的 Pep/8 计算 机 。 本 章 将 讲述 Asmb5 层 ， 也 就 是 汇 
编 层 的 Pep/8。 这 两 层 之 间 是 操作 系统 。 记 住 抽 象 分 层 的 目的 是 隐藏 系统 在 更 低层 次 的 细节 。 
你 可 以 使 用 操作 系统 的 陷阱 处 理 程序 而 不 需 知道 它 的 操作 细节 ， 即 你 将 了 解 到 陷阱 处 理 程 序 
做 什么 而 不 需 知道 它 是 怎样 做 的 。 我 们 在 第 8 章 讲述 陷阱 处 理 程序 的 内 部 工作 原理 。 


5.1 汇编 程序 

Asmb5 层 的 语言 叫 作 汇编 语言 ， 它 提供 了 一 种 比 二 进 制 更 加 方便 的 编写 机 器 语言 程序 
的 方法 。 图 4-32 的 程序 输出 Hi， 包含 两 类 位 模式 ,一 种 是 程序 ， 一 种 是 数据 。 冯 ，… KS 
设计 原理 直接 导致 这 两 种 类 型 的 产生 ， 因 为 程序 和 数据 共享 内 存 ， 每 种 都 需要 一 种 二 进 制 
表示 。 

汇编 语言 包含 两 种 类 型 的 语句 ， 分 别 对 应 这 两 种 类 型 的 位 模式 。 助 记 符 语句 对 应 指令 位 
模式 ， 伪 操作 对 应 数据 位 模式 。 


5.1.1 ”指令 助 记 符 
假定 内 存 中 某 个 位 置 有 机 器 语言 指令 
C0009A 


它 是 装 和 寄存 器 r 指 令 。 寄 存 器 -r 位 为 0， 表 示 是 累加 器 而 不 是 变 址 寄存 器 ， 寻 址 -aaa F 
段 是 000， 表 明 是 立即 数 寻 址 。 
这 条 指令 用 Pep/8 汇编 语言 来 写 是 


LDA 0x009A, i 





Di | seat | 

助 记 符 LDA 表示 装 人 累加 器 ， 用 以 代替 操作 码 一 
1100 和 寄存 器 -r 字段 0。 助 记 符 是 辅助 记忆 的 ol | 直接 | a | 
工具 。 记 住 LDA 代表 装 人 累加 器 指令 要 比 记 住 [oo | me | a | 
操作 码 1100 和 寄存 器 -r 为 0 代表 装载 累加 器 指 | ol | 校对 | 。 
令 更 为 容易 。 操 作 数 指示 符 以 十 六 进 制 形式 书 | 100 | 栈 相对 间接 | sf | 
写 ， 为 009A， 前 面 加 0x， 表 示 是 十 六 进 制 常 | 10 | we /| x* 
量 。 在 Pep/8 汇编 语言 中 ， 通 过 在 操作 数 指示 符 | 10 | Ræ | sx o 
后 放 一 个 或 多 个 字母 来 指定 寻 址 方式 , 字母 和 | 1 | Banag | sxf 





操作 数 指示 符 之 间 以 逗号 分 隔 。 图 5-1 展示 了 与 图 5-1 Pep/8 汇编 语言 中 表示 寻 址 方式 的 字符 


8 种 寻 址 方式 相对 应 的 字母 。 
例 5.1 这 里 有 一 些 例子 ， 是 用 二 进 制 机 器 语言 和 汇编 语言 编写 的 装 人 寄存 器 Tr 指 令 。 
LDX 对 应 和 LDA 一 样 的 机 器 语言 语句 ， 除 了 对 LDX 来 说 ， 寄 存 器 -r 位 为 1 而 不 是 0。 


1100 0011 0000 0000 1001 1010 LDA 0x009A,s 
1100 0110 0000 0000 1001 1010 LDA 0x009A,sx 
1100 1011 0000 0000 1001 1010 LDX Ox009A,s 
1100 1110 0000 0000 1001 1010 LDX Ox009A,sx 


图 5-2 总 结 了 在 AsmbS 层 Pep/8 4844285 39 条 指令 ， 它 给 出 了 每 个 操作 码 对 应 的 助 记 
符 以 及 指令 的 含义 。 寻 址 方式 列 说 明 人 允许 哪 些 寻 址 方式 或 者 指令 是 否 是 一 元 指令 (U), AA 
位 列 说 明 指 令 执 行 会 影响 的 状态 位 。 


指令 指示 符 
Rit A 






寻 址 方式 状 态 位 





oo000010 | movsea | 把 SpfaA 
000010 | BR | 从 人 支 
[00001108 | eene |FST9 妈 
一 oo | eree | 大 等 分 
to | BRv [mvs a 


iii 


1 
1 


x 
本 
LX 


Z 


NZV 
NZVC 
NZC 


NOTr 
| 
| 00100inn | MoPn | 一 元 空 操作 陷阱 
00101aaa | NoP | 非 一 元 空 操作 陷阱 
d, n, s, sf, x, sx, sxf NZV 
i, d, n, s, sf, x, sx, sxf 
字符 串 输出 陷阱 d, n, sf 
i, d, n, s, sf, x, sx, sxf 
| 0101 nnn | RETn | 从 调用 返回 n 个 本 地 字 节 |U 
加 到 栈 指针 CSP) 上 i, d, n, s, sf, x, sx, sxf 
imee | r A asa a 
i, d, n, s, sf, x, Sx, sxf 
= 立 
k= Vv 





ii 








NZVC 
NZVC 

力 NZVC 
i, d, n, 8, sf, x, 8x, sxf 


图 5-2 Pep/8 的 Asmb5 层 指令 集 


Ziz 
NIN 





NZVC 
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| lllormaaa | srr | 把 r 存 储 到 内 存 ds sfx sxssxf | 
Mra |  STBYTEr | 把 字 节 r 存 储 到 内 存 |dnssfxsxsf | o 


图 5-2 ( 续 ) 


图 5-2 还 给 出 了 5 条 没有 对 应 机 器 指令 的 新 指令 : 

NOPn 一 元 空 操作 陷阱 

NOP 非 一 元 空 操作 陷阱 

DECI 十 进 制 输入 陷阱 

DECO 十 进 制 输 出 陷阱 

STRO 字符 串 输出 陷阱 

这 些 新 指令 对 Asmb5 层 的 汇编 语言 程序 员 是 可 用 的 ， 但 不 是 ISA3 层 指 令 集 的 一 部 分 。 
OS4 层 的 操作 系统 会 向 它们 提供 陷阱 处 理 程序 。 在 汇编 层 ， 你 可 以 用 它们 来 编程 ， 仿 佛 它们 
就 是 ISA3 层 指令 集 的 一 部 分 ， 尽 管 实 际 上 它们 并 不 是 。 第 8 章 会 详细 介绍 操作 系统 是 怎样 
提供 这 些 指 令 的 。 不 过 用 它们 进行 编程 ， 并 不 需要 知道 实现 它们 的 细节 。 


5.1.2 伪 操 作 


伪 操 作 ( pseudo-ops) 是 汇编 语言 语句 ， 它 没有 操作 码 ， 不 对 应 Pep/8 指令 集 39 条 指令 
中 的 任何 一 条 。Pep/8 汇编 语言 有 8 个 伪 操 作 : 

.ADDRSS 符号 的 地 址 

.ASCII ASCII 字 节 字符 串 

.BLOCK “HR 

.BURN ”初始 ROM A 

.BYTE ”一 个 字 节 值 

.END 汇编 左 标 记 

.EQUATE 将 一 个 符号 等 同 于 一 个 常量 值 

.WORD 一 个 字 值 

除了 .BURN、.END 和 .EQUATE 外 ， 所 有 的 伪 操 作 都 把 数据 位 插入 机 器 语言 程序 中 。 
“ 伪 ” 的 意思 是 “ 假 ”， 称 它们 为 伪 操 作 是 因为 它们 产生 的 位 不 对 应 操作 码 ， 不 像 那 39 个 指 
令 助 记 符 产生 的 位 那样 ， 它 们 不 是 真正 的 指令 操作 。 伪 操作 也 叫 作 汇 编 器 指示 字 (assembler 
directive)， 或 者 叫 作 点 命令 (dot command)， 因 为 汇编 语言 中 这 些 指令 前 都 有 个 点 (.)。 

接 下 来 的 3 个 程序 展示 怎样 使 用 .ASCII、.BLOCK、.BYTE、.END 和 .WORD 伪 操 作 ， 
其 他 伪 操 作 后 面 讲述 。 


5.1.3 .ASCII 和 .END 伪 操 作 

图 5-3 是 用 汇编 语言 而 不 是 机 胡 语 言 写 的 图 4-32 中 的 程序 。 与 C++ 不 同 ，Pep/8 汇编 语 
言 是 面向 行 的 ， 即 每 条 汇编 语言 语句 必须 包含 在 一 行内 ， 不 能 把 一 条 语句 持续 到 下 一 行 ， 也 
不 能 把 两 条 语句 放 在 同一 行 中 。 

注释 以 分 号 ; 开始 ， 一 直到 本 行 末端 。 在 一 行 中 只 有 注释 是 允许 的 ， 但 它 必 须 以 分 号 开 


BSE 
C++ 一 样 ， 汇 编 语言 程序 中 至 少 应 该 包含 名 字 、 日 期 和 
含 这 样 的 程序 头 。 

CHARO 
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CHARO 是 字符 输出 指令 的 助 记 符 。 语 句 
0x0007,d 


LAEE 
台 。 这 个 程序 的 前 4 行 都 是 注释 行 ，CHARO 指令 也 包含 注释 ， 不 过 是 在 汇编 语句 的 后 面 。 和 
程序 的 描述 。 不 过 水 书 为 了 节约 篇 幅 ， 下 面 的 程序 不 包 | BBB 

:Stan Warford 
:0utput 'H' 


;January 13, 2009 
表示 “用 直接 寻 址 方式 从 Mem[0007] 输出 一 个 字符 ”。 


CHARO 
.ASCII 伪 操 作 生 成 连续 的 ASCII 字符 字 节 。 在 汇 


;A program to output "Hi" 


0x0007,d 
CHARO 


0x0008,d 
STOP 
编 语言 中 ， 可 以 简单 地 写 .ASCII， 然 后 在 后 面 跟 双 引 


号 括 起 来 的 一 个 字符 串 。 寿 字符 串 中 包含 双 引 号 ， 那 么 
必须 在 它 前 面 加 一 个 反 斜 杠 ， 夺 包含 有 反 斜 村 ， 就 要 在 


;Output ‘H' 

;Output 
LT 
.END 


汇编 器 输出 


án 


E BY Bu TF RAT. Æ BD TE JS AT. EF 
中 插入 一 个 制 表 符 。 


符 串 中 插入 一 个 换行 符 ， 在 t 前 面 加 反 斜 杠 将 在 字符 串 
"She said, 


例 5.2 这 是 一 个 包含 两 个 双 引 号 的 字符 串 : 
\"Hel IOT." 


程序 输出 
Hi 





这 是 一 个 包含 反 斜 杠 符 的 字符 串 : 
"My bash is \\." 


51 00 07 51 00 08 00 48 69 zz 


这 是 一 个 有 换行 符 的 字符 串 : 


图 5-3 一 个 汇编 语言 程序 ， 输 出 Hi 。 
它 是 图 4-32 的 汇编 语言 版 

"\nThis sentence will output on a new line.” 
使 用 \x 特性 ， 字 符 串 常量 中 可 以 包含 任何 一 个 字 节 。 当 字符 串 常 量 中 包含 \x AT, IC 
编程 序 会 预期 接 下 来 的 两 个 字符 是 十 六 进 制 数字 ， 指 定 了 你 想 包 含 在 字符 串 中 的 字 节 。 
例 5.3 点 命令 
.ASCII "Hello\nworld." 

和 


ASCII 


LJ 
"Hel lo\xOAworld\x2E" 
生成 同样 的 字 节 序列 ， 即 


48 65 6C 6C 6F OA 77 6F 72 6C 64 2E 
汇编 语言 


序 必 须 以 .END 
5.1.4 


Le Ay ot: 


ANY =A 
iL Fa 88 


>H. — 
laa 


口 

束 。 它 不 会 像 .ASCII 命令 那样 在 程序 中 插入 数据 位 ， 

它 仅 表示 汇编 语言 程序 的 结束 。 汇 编 器 用 .END 作为 标记 符号 ， 以 便 知道 何 时 应 该 停止 转换 。 
用 汇编 语言 编写 的 程序 与 用 机 器 


译 成 机 器 语言 。 


编写 的 相同 程序 相 比 ， 由 于 在 操作 码 的 位 置 使 用 了 
助 记 符 ， 所 以 汇编 语言 更 容易 理解 ， 用 ASCI 字符 直接 写 的 字符 H 和 i 也 更 易 读 。 
遗憾 的 是 ， 不 能 简单 地 用 汇编 语言 写 一 个 程序 ， 就 指望 计算 机 可 以 理解 它 。 计 算 机 只 能 
通过 执行 冯 … 诺 依 曼 运行 周期 ( 取 指 、 译 码 、 增 加 PC、 执行 、 重 复 ) 来 执行 程序 ， 这 是 固 


化 在 CPU 中 的 。 如 第 4 章 所 述 ， 为 了 执行 周期 能 正确 地 处 理 程序 ， 它 必须 以 二 进 制 形 式 存 
储 在 从 地 址 0000 开始 的 主 存 中 。 因 此 在 狼人 和 执行 前 ， 汇 编 


B. == 7h. 


ta vA lm 


句 必须 以 茶 种 方式 被 翻 
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在 早期 ， 程 序 员 用 汇编 语言 写 程序 ， 然 后 手工 把 每 条 语句 翻译 成 机 器 语言 。 这 个 翻译 其 
实 很 简单 ， 它 只 是 查询 指令 的 二 进 制 操作 码 和 在 ASCII 表 中 查询 ASCII 字符 的 二 进 制 编码 。 
类 似 地 ， 用 十 六 进 制 转换 表 把 十 六 进 制 操作 数 转换 为 二 进 制 格式 。 只 有 在 翻译 后 ， 程 序 才 可 


以 装 人 并 执行 。 


翻译 长 程序 是 一 项 无 聊 又 单调 的 工作 。 很 快 程序 员 就 意识 到 可 以 写 一 个 计算 机 程序 来 做 
这 个 翻译 工作 ， 这 样 的 程序 叫 作 汇编 器 ， 图 5-4 说 明了 它 的 主要 功能 。 

汇编 右 是 这 样 的 一 个 程序 ， 它 输入 汇编 语言 程序 ， 输 出 把 这 个 程序 翻译 成 适合 装载 器 格 
式 的 机 器 语言 。 汇 编 右 的 输入 称 为 源 程序 ， 输 出 称 为 目标 程序 。 图 5-5 展示 了 Pep/8 汇编 器 


处 理 图 5-3 汇编 语言 的 效果 。 





输入 







CHARO 
CHARO 
STOP 





. END 


图 5-4 汇编 器 的 功能 





0x0007,d 
0x0008,d 


-ASCII "Hi ~” 


输出 


51 00 07 51 00 
08 00 48 69 zz 


处 理 













图 5-5 Pep/8 汇编 器 对 图 5-3 所 示 程 序 所 做 的 操作 


认识 到 汇编 右 只 是 把 程序 翻译 成 适合 装载 器 的 格式 是 很 重要 的 。 它 并 不 执行 程序 ， 翻 译 


和 执行 是 两 个 分 离 的 过 程 ， 总 是 先进 行 翻译 。 


因为 汇编 嚣 本身 是 一 个 程序 ， 所 以 必须 用 某 种 编程 语言 来 编写 。 写 出 第 一 批 汇编 器 的 计 
算 机 先驱 不 得 不 使 用 机 器 语言 来 编写 。 否 则 ， 如 果 他 们 用 汇编 语言 来 写 ， 由 于 那 时 还 没有 汇 


编 嚣 可用， 他 们 就 不 得 不 手工 再 翻译 成 机 
能 语言 。 重 点 是 机 右 只 能 执行 用 机 器 语言 
写 的 程序 。 


5.1.5 .BLOCK 伪 操 作 


图 5-6 是 图 4-34 中 程序 的 汇编 语言 
本 。 它 输入 两 个 字符 ， 按 照相 反 的 顺序 输 
出 它们 。 

从 汇编 程序 的 输出 可 以 看 到 第 一 条 输入 
语句 CHARI 0x000D，d 翻译 成 了 49000D, 
最 后 一 条 输出 语句 CHARO 0x000D，d 翻译 
成 了 51000D， 再 后 面 的 STOP 语 句 翻 译 
成 00。 

.BLOCK 伪 操 作 生 成 接 下 来 的 两 个 0 字 
节 。 点 命令 

.BLOCK 1 
意思 是 “生成 一 个 1 字 节 存储 块 ”" 。 汇 编程 





汇编 器 输入 
CHARI 0x000D,d 
CHARI Ox000E,d 
CHARO 0x000E,d 
CHARO 0x000D,d 
STOP 

.BLOCK 1 

.BLOCK 1 

.END 


;Input first character 

;Input second character 
;Output second character 
;Output first character 


;Storage for first char 
;Storage for second char 


汇编 器 输出 
49 00 OD 49 00 OE 51 00 OE 51 00 OD 00 00 00 zz 


程序 输入 

up 

程序 输出 

pu 

图 5-6 一 个 输入 两 个 字符 并 以 相反 顺序 输出 它们 的 


汇编 语言 程序 。 这 是 图 4-34 所 示 程 序 的 汇 
编 语 言 版 本 
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序 把 任何 不 以 Ox 开头 的 数字 当 作 十 进 制 整数 ， 因 此 数字 1 被 当 作 十 进 制 整数 。 汇 编程 序 预 
期 .BLOCK 后 面 是 一 个 常量 ， 然 后 产生 这 个 数量 字 节 的 存储 空间 ， 并 把 它们 置 为 0。 在 这 个 
程序 中 ， 可 以 用 一 条 


.BLOCK 2 


代替 那 两 条 .BLOCK 命令 ， 它 的 意思 是 “生成 一 个 2 字 节 存储 块 ” 。 尽 管 汇编 堪 的 输出 是 一 

样 的 ， 但 是 在 汇编 语言 程序 中 就 不 能 在 .BLOCK 行 上 写 两 条 单独 的 注释 。 

5.1.6 .WORD 和 .BYTE 伪 操 作 197 
图 5-7 和 图 4-35 一 样 ， 计 算 5 加 上 3， 它 说 明 .WORD 伪 操 作 的 用 法 。 198 
和 .BLOCK 命令 一 样 ，.WORD 命令 也 是 为 装载 TAREN 


ERRA, 但 是 有 两 点 不 同 。 HJG, . WORD LDA 0x0011,d ;A <- first number 
命令 总 是 生成 一 个 字 ( p sy 的 代码 ， 不 能 ADDA 0x0013,d ;Add the two numbers 





aie ; = cig ORA 0x0015,d ;Convert sum to character 

生成 任意 数量 的 字 节 ; 其 次 ， 程 序 员 能 指定 字 | STBYTEA 0x0010,d :store the character 
的 内 容 点 命令 0x0010,d ;Output the character 

.WORD 5 :Character to output 

` 17 99 . + 1 
的 意思 是 “生成 一 个 值 为 5 (dec) 的 字 ”。 点 | PEREN 
命令 .WORD 0x0030 ;Mask for ASCII char 
END 

.WORD 0x0030 ees 
4 H ét S m9 y | 
的 意思 是 “生成 一 个 值 为 0030 Chex) 的 字 。 C1 00 11 71 00 13 Al 00 15 F1 00 10 51 00 10 00 

BYTE 命令 和 .WORD 命令 的 工作 方式 一 | oo 00 05 00 03 00 30 zz 
样 ， 除 了 它 生 成 1 字 节 的 值 而 不 是 生成 一 个 字 | 程序 输出 
的 值 外 。 在 这 个 程序 中 ， 可 以 把 8 

.WORD 0x0030 图 5-7 一 个 把 3 加 上 5 并 输出 单个 字符 结果 的 
替换 为 汇编 语言 程序 。 它 是 图 4-35 所 示 程 序 的 

= 

.BYTE 0x00 汇编 语言 版 本 

.BYTE Ox30 
它 会 生成 同样 的 机 器 语言 。 


可 以 把 这 个 汇编 语言 程序 经 过 汇编 副 的 输出 和 图 4-35 NE till DLA BS ETT ERR, 
你 会 发 现 它 们 是 一 样 的 。 把 汇编 融 设 计 成 让 它 产 生 的 输出 完全 遵循 装载 胡 期 望 的 格式 ， 没 
有 前 导 空 行 或 空格 。 字 节 间 只 能 有 1 个 空格 ， 每 一 行 的 结尾 都 没有 空格 。 字 节 序 列 以 zz 
结束 。 


5.1.7 使 用 Pep/8 汇编 器 
执行 图 5-6 中 的 程序 ， 这 个 逆序 输出 输入 处 理 输出 
AS tea AE ET J 5 i 应 用 汇编 需 应 用 
coca! healt 
上 运行 图 5-8 所 示 的 步骤 。 


首先 把 汇编 器 装 人 主 存 ， 把 应 用 程序 ncn 


作为 输入 文件 ， 此 运行 的 输出 是 这 个 应 用 应 用 
程序 的 机 器 语言 版 本 ， 接 着 第 二 次 运行 就 


A 


把 这 个 输出 装 入 主 存 。 中 间 两 个 框 里 的 所 图 5-8 执行 图 5-6 所 示 程 序 需要 计算 机 运行 两 条 命令 
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有 程序 必须 是 机 需 语 言 写 的 。 
Pep/8 系统 除了 有 汇编 器 之 外 ， 还 有 一 个 模拟 器 。 当 执行 汇编 器 时 ， 必 须 提供 给 它 一 个 
之 前 用 文本 编辑 生成 的 汇编 语言 [一 
a 汇编 器 输入 
程序 。 和 如果 你 的 程序 没有 错误 ， hari 0x000D,d Input first ch t 
、 chari 0x ;Inpu rst character 
那么 汇编 大 将 生成 适合 装载 硕 格 CHARI 0x000E ,d ;Input Second character 


式 的 目标 人 代码， 否则 它 将 给 出 一 | charo 0x000E， d ;Output second character 
TE y CHarO 0x000D,D ;Output first charact 

条 或 多 条 出 错 信息 并 说 明 未 生成 ms pa ai 

代码 。 从 一 个 没有 错误 的 程序 生 .bloCK 1 ;Storage for first char 


成 代码 后 可 以 用 第 4 章 讲述 的 .BLOCK 1 ;Storage for second char 
f . END 

BRAD te OR EAE o 

写 汇编 语言 程序 时 ， 助 记 符 或 

Addr Code Mnemon Operand Comment 

AA [> IFS 
者 点 命令 后 面 至 少 要 有 [=e TH o 0000 49000D CHARI Ox0000,d ;Input first character 
除 此 之 外 ， 对 空格 没有 其 他 限制 。 | 0003 49000E CHARI Ox000E,d ;Input second character 
` it S 0006 51000E CHARO 0x000E,d ;Output second character 
Wa nl I> INE ` 
UEF ALA PAPO, 例如 0009 51000D CHARO Ox000D,d ;Output first character 


图 5-6 中 的 源 程 序 可 以 写 为 图 $-9 | oooc 00 STOP 


汇编 器 列表 





中 那样 ， 汇 编程 序 也 会 认为 它 是 | 0000 00 „BLOCK 1 :Storage for first char 
9 . ;Storage for second char 
有 效 的 ， 接 受 并 生成 正确 的 代码 。 | oor ew om au et 
BR T A pe a tt AE N H Pa RAS 
外 ， 汇 编程 序 允 许 生成 程序 列表 。 图 5-9 一 个 合法 的 源 程序 和 输出 的 汇编 器 列表 


汇编 硕 列 表 把 源 程 序 转换 成 大 小 写字 母 和 空格 一 致 的 格式 。 图 5-9 中 展示 的 是 无 格式 源 程 序 
AY YL Satie WY Ze 

这 个 列表 也 展示 了 每 一 行 生成 的 十 六 进 制 目标 代码 ， 以 及 装载 右 会 把 它 装 和 人 的 第 一 个 字 
节 的 地 址 。 注 意 .END 命令 不 会 生成 任何 目标 代码 。 

本 书 接 下 来 的 汇编 语言 程序 都 是 以 汇编 紫 列 表 的 形式 给 出 的 ， 不 过 不 包括 这 张 图 里 有 
的 、 汇 编 器 生成 的 列 头 部 。 第 二 列 是 机 器 语言 目标 代码 ， 第 一 列 是 装载 器 会 把 它 装 人 主 存 中 
的 地 址 。 这 是 大 多 数 汇编 部 使 用 的 典型 布局 。 这 形象 地 展示 了 ISA3 层 机 融 语 言 和 Asmbs Jz 
汇编 语言 之 间 的 对 应 关系 。 


5.1.8 3E Milage 


—A EP La BAA AAS REPO LAB ANE Oe, Ale, — Ahi 
牌 计算 机 的 机 器 语言 程序 不 能 在 另 一 种 品牌 的 机 器 上 运行 。 

如 果 用 汇编 语言 给 一 种 个 人 计算 机 写 应 用 程序 ， 通 常 要 在 这 种 计算 机 上 进行 汇编 。 用 该 
汇编 器 所 要 转换 成 的 语言 编写 的 汇编 器 叫 作 常 驻 汇编 器 (resident assembler). ix PLACA AM 
应 用 程序 运行 在 同样 的 机 器 上 ， 图 5-8 中 的 汇编 器 和 应 用 程序 就 是 运行 在 同一 台 机 器 上 的 。 

不 过 也 有 可 能 用 X 品牌 机 器 的 机 器 语言 写成 的 汇编 程序 把 应 用 程序 翻译 成 另 一 种 Y 品 
牌 机 器 的 机 需 语 言 。 那 么 这 个 应 用 程序 不 能 在 翻译 它 的 机 器 上 执行 ， 必 须 先 把 它 从 X 品牌 
机 需 移 到 立 品牌 机 郝 上 。 / 

交叉 汇编 器 生成 的 目标 程序 所 适用 的 机 器 ， 不 同 于 运行 汇编 器 的 机 器 。 把 应 用 程序 
的 机 器 语言 版 本 从 X 品牌 机 器 的 输出 文件 移 到 站 品牌 机 器 的 主 存 ， 这 个 过 程 称 作 下 载 
( downloading), X 品牌 机 器 叫 作 宿主 机 ，Y 品牌 机 器 叫 作 目标 机 。 在 图 5-8 中 ， 第 一 个 命令 
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运行 是 在 宿主 机 上 ， 第 二 个 命令 运行 是 在 目标 机 上 。 

这 种 情况 经 常 发 生 在 当 目 标 机 需 是 某 种 小 型 特殊 用 途 的 计算 机 时 ， 比 如 控制 微波 炉 吉 饪 
周期 的 计算 机 。 汇 编 器 是 需要 大 量 主 存 ， 以 及 输入 /输出 外 围 设 备 的 程序 。 控 制 微波 炉 处 理 
器 的 主 存 非 常 小 ， 它 的 输入 只 是 控制 面板 上 的 按键 ， 也 许 还 有 来 目 于 温度 探测 需 的 信号 ， 它 
的 输出 包括 数字 显示 和 控制 亮 饪 元 件 的 信号 。 因 为 它 没有 输入 /输出 文件 ， 所 以 它 不 能 为 目 
己 运行 汇编 器 。 必 须 有 一 个 更 大 牡 主机 为 它 把 程序 汇编 成 目标 语言 ， 然 后 它 册 从 牡 主 机 上 下 
载 该 目标 语言 程序 。 


5.2 ”立即 数 寻 址 和 陷阱 指令 


在 直接 寻 址 方式 中 ， 操 作 数 指示 符 是 操作 数 在 主 存 中 的 地 址 。 数 学 表达 是 
Oprnd = Mem[OprndSpec] 
但 是 在 立即 数 寻 址 方式 中 ， 操 作 数 指示 符 就 是 操作 数 : 
Oprnd = OprndSpec 
采用 直接 寻 址 方式 的 指令 包含 操作 数 的 地 址 ， 而 采用 立即 数 寻 址 方式 的 指令 包含 操作 数 本 号 。 


5.2.1 立即 数 寻 址 


图 5-10 展示 了 怎样 用 立即 数 寻 址 方式 来 写 图 5-3 中 的 程序 。 这 个 程序 输出 Hi 。 
汇编 程序 把 字符 输出 指令 + 
500048 CHARO ‚Output 'H 
CHARO 'H',i 500069 CHARO 'i',i ;Output 'i' 
翻译 成 目标 代码 500048 (hex)， 即 二 进 
制 的 


0101 0000 0000 0000 0100 1000 


查找 图 5-2 会 发 现 0101 0 CHARO 指 oo 
令 的 操作 码 ， 寻 址 -aaa 字段 是 000 (bin), 图 5-10 一 个 采用 立即 数 寻 址 方式 的 输出 Hi 的 程序 
表示 是 立即 数 寻 址 。 如 图 5-1 所 示 ，.i 表示 立即 数 寻 址 。 

字符 常量 用 单 引 号 扩 起 来 ,它们 总 是 生成 1 字 节 的 代码 。 在 图 5-10 的 程序 中 ， 字 符 常 
量 放 在 操作 数 指示 符 里 ， 操 作 数 指示 符 占用 2 字 节 。 这 种 情况 下 ， 字 符 常量 位 于 这 2 字 节 中 
右边 的 那 一 个 。 

汇编 器 就 是 这 样 把 语句 翻译 成 二 进 制 的 。 但 是 当 装 载 器 把 程序 装 人 并 执行 第 一 条 语 铝 
时 会 发 生 什 么 呢 ? 如 果 寻 址 方式 是 直接 寻 址 ， 那 么 CPU 会 把 0048 作为 地 址 ， 指 示 主 存 把 
Mem[0048] 放 到 总 线 上 供 输 出 设备 使 用 。 由 于 寻 址 方式 是 立即 数 寻 址 ， 所 以 CPU 会 把 0048 
当 作 操 作 数 本 身 ( 而 不 是 操作 数 的 地 址 )， 并 把 48 放 到 总 线 上 供 输出 设备 使 用 。 第 二 条 指令 
对 0069 进行 类 似 的 操作 。 

与 直接 寻 址 相 比 ， 立 即 数 寻 址 有 两 个 优点 。 因 为 ASCII 字符 串 和 指令 不 需要 分 开 存 储 ， 
所 以 程序 可 以 更 短 。 图 5-3 中 的 程序 是 9 字 节 ， 而 这 个 程序 是 7 字 节 。 因 为 操作 数 在 指令 寄 
存 器 中 ， 对 CPU 来 说 是 立即 可 用 的 ， 所 以 指令 执行 也 更 快 。 夺 用 直接 寻 址 方式 ，CPU 必须 
额外 访问 主 存 以 获取 操作 数 。 


5.2.2 DECI、DECO 和 BR 指令 
截至 目前 我 们 已 经 学 到 的 汇编 语言 特色 相 比 于 机 器 语言 有 了 很 大 的 改进 ， 但 是 仍 有 几 个 


. END 
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不 尽 如 人 意 的 地 方 。 图 5-11 中 的 程序 说 明了 这 些 地 方 ， 这 个 程序 输入 一 个 十 进 制 的 值 ， 把 
它 加 1， 然后 输出 和 。 


0000 040005 BR 0x0005 :Branch around data 
0003 0000 .BLOCK 2 :Storage for one integer 


0005 310003 DECI 0x0003,d ;Get the number 
0008 390003 DECO 0x0003,d ;and output it 
000B 500020 CHARO = -i sOutput “+i =" 
000E 50002B CHARO hpt 
0011 500020 CHARO . 
0014 500031 CHARO oh 
0017 500020 CHARO ; 
001A 50003D CHARO "am! 
001D 500020 CHARO 


~ = 
- . - - . 
de 一 2 一 一 人 —_. 一 2 


0020 C10003 LDA 0x0003,d :A <- the number 
0023 700001 ADDA ll ;Add one to it 
0026 £10003 STA 0x0003,d ;Store the sum 
0029 390003 DECO 0x0003,d ;Output the sum 
002C 00 STOP 

002D . END 

输入 

-479 

输出 


-479 + 1 = -478 


图 5-11 一 个 输入 十 进 制 值 ， 加 1 并 输出 和 的 程序 
图 5-7 的 第 一 条 指令 


LDA 0x0011,d ;A <- the number 
把 Mem[0011] 的 内 容 放 和 人 累加 器 。 要 写 这 条 语句 ， 程 序 员 必须 知道 第 一 个 数字 要 存储 在 程 
序 指令 部 分 的 后 面 、 地 址 为 0011 (hex) 的 地 方 。 但 把 数据 放 到 程序 末尾 的 问题 是 ， 要 到 写 
完 程序 你 才能 知道 程序 指令 部 分 的 确切 长 度 ， 而 当 写 这 条 需要 数据 地 址 的 指令 时 ， 还 不 知道 
数据 的 地 址 。 

为 一 个 问题 是 修改 程序 。 假 设想 在 程序 中 插入 一 条 语句 ， 这 样 的 一 个 修改 将 会 改变 数据 
的 地 址 ， 从 而 也 要 修改 每 条 引用 这 些 数据 的 指令 以 反映 新 的 地 址 。 如 果 把 数据 放 在 程序 的 上 
H, XF Asmb5 层 程序 来 说 会 更 简单 。 此 时 ， 当 你 写 一 条 引用 数据 的 语句 时 ， 就 已 经 知道 
数据 的 地 址 了 。 

图 5-7 所 示 程 序 的 另 一 个 不 尽 如 人 意 的 地 方 是 ， 由 于 CHARO 的 限制 导致 对 结果 只 能 是 
单字 符 的 限制 。 因 为 CHARO 只 能 输出 1 字 节 的 ASCII 字符 ， 所 以 很 难 对 ASCII 表示 的 超过 
一 个 数字 的 十 进 制 值 执行 IO 操作 。 

图 5-11 中 的 程序 解决 了 这 两 个 问题 。 它 输入 一 个 整数 ， 加 1， 然 后 输出 和 。 数据 存储 在 
程序 开始 的 部 分 ， 并 人 允许 使 用 大 的 十 进 制 值 。 / 

在 Pep/8 模拟 器 选择 执行 选项 时 ，PC 获得 值 0000 (hex). CPU 会 把 在 Mem[0000] 处 的 
字 节 作为 第 一 条 指令 来 执行 。 为 了 把 数据 放 在 程序 的 上 部 ， 我 们 需要 一 条 指令 ， 当 CPU 获 
取 下 一 条 指令 时 ， 这 条 指令 会 让 CPU 跳 过 数据 字 节 。 无 条 件 分 支 指 令 BR 就 是 这 样 的 指令 ， 
它 只 是 把 指令 的 操作 数 放 入 PC 中 。 在 这 个 程序 里 ， 
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BR 0005 ;Branch around data 
把 0005 BLA PC。BR. 指 令 的 RTL 描述 是 

PC < Oprnd 
在 下 一 个 执行 周期 的 取 指 部 分 ，CPU 会 从 地 址 0005 而 不 是 地 址 0003 获取 指令 ， 如 果 没 有 
修改 PC， 就 会 去 0003 处 取 指 令 。 

因为 分 支 指令 几乎 总 是 使 用 立即 数 寻 址 方式 ， 所 以 Pep/8 汇编 器 不 要 求 指 定 寻 址 方式 。 如 果 
对 转移 指令 不 指定 寻 址 方式 ， 那 么 汇编 器 就 假设 是 立即 数 寻 址 ， 并 为 寻 址 -a 字段 生成 0。 

BR 指令 的 正确 操作 取决 于 冯 : 诺 依 曼 执 行 周期 的 细节 。 例 如 ， 你 可 能 会 好 奇 ， 为 什么 
这 个 周期 是 取 指 ， 译 码 、 增 加 PC、 执行 和 重复 ， 而 不 是 取 指 、 译 码 、 执 行 、PC 增加 和 重 
复 。 图 4-33f 展示 了 当 PC 值 为 0003 时 ， 执 行 指令 510007 输出 H，0003 是 指令 510008 的 
地 址 。 如 果 冯 … 诺 依 曼 执行 周期 的 执行 部 分 在 PC 增加 部 分 的 前 面 ， 那 么 当 在 地 址 0000 的 
指令 510007 执行 时 ，PC 的 值 为 0000。 貌 似 PC 对 应 于 正在 执行 的 指令 更 讲 得 通 ， 但 为 何 
冯 “ 诺 依 曼 执行 周期 不 把 执行 放 在 PC 增加 的 前 面 呢 ? 

这 是 因为 如 果 那 样 ，BR 就 无 法 正确 工作 了 。 在 图 5-11 中 ，PC 获得 0000，CPU 就 会 获 
取 BR 指令 040005，BR 执行 ， 把 0005 放 入 PC 中 ， 接 着 PC 将 增加 到 0008。 此 时 ， 程序 将 
转移 到 0008 而 不 是 0005。 因 为 指令 集 包 含 分 支 指 令 ， 所 以 汉 : 诺 依 曼 执行 周期 的 PC 增加 
一 定 要 在 执行 部 分 之 前 。 

DECI 和 DECO 是 两 条 操作 系统 提供 给 汇编 层 的 指令 ，Pep/8 硬件 不 在 机 器 层 提供 这 两 条 指 
令 。DECI 代表 十 进 制 输入 ， 它 把 一 个 ASCII 数字 字符 序列 转换 为 一 个 字 ， 对 应 于 该 数值 的 补 
码 表示 。DEC0O， 即 十 进 制 输出 ， 做 相反 的 操作 ， 把 一 个 字 长 的 补 码 值 转换 为 ASCI 字符 序列 。 

DECI 允许 在 输入 中 有 任何 数量 的 前 导 空 格 和 空 行 。 第 一 个 可 打印 的 字符 必须 是 十 进 制 
数字 ，+ 或 者 -， 接 下 来 的 数字 必须 是 十 进 制 数字 。 如 果 输 入 为 0，DECI 把 Z 置 为 1， 如 果 
输入 为 负 值 ， 它 把 NN 置 为 1。 如 果 输 入 值 超 出 范围 ， 它 把 V 置 为 1。 因 为 一 个 字 是 16 位 ， 
2'6 = 32768， 所 以 范围 是 -32768 到 32767 (dec), DECI 不 影响 C 位。 

如 果 值 为 负 ，DEC0 输出 -, 但 是 如 果 值 为 正 , 不 输出 +。 它 不 输出 最 前 面 的 0， 只 输出 
能 正确 表示 该 数值 的 尽 可 能 少 的 字符 。 不 能 指定 字段 的 宽度 。DEC0 不 影响 NZVC 位 。 

在 图 5-11 中 ， 当 面 对 输 入 序列 -479 时 ， 语 名 

DECI 0x0003,d ;Get the number 


把 它 转换 为 1111 1110 0010 0001 (bin)， 存 储 在 Mem[0003]. DECO 把 二 进 制 序列 转换 为 
ASCII 字符 串 输出 。 


5.2.3 STRO 指令 


你 可 能 已 经 注意 到 了 ， 图 5-11 中 的 程序 需要 7 个 CHARO 指令 来 输出 字符 串 “+1=”， 每 
个 输出 的 ASCH 字符 需要 一 个 CHARO 指令 。 图 5-12 中 的 程序 说 明了 STRO 指令 ， 指 令 名 字 
的 含义 是 字符 串 输出 。 这 又 是 一 条 在 机 器 层 触发 陷阱 的 汇编 层 真实 指令 ， 它 让 你 只 用 一 条 指 
令 就 能 输出 完整 的 7 个 字符 的 字符 串 。 

STRO 的 操作 数 是 一 个 连续 的 字 节 序列 ， 序 列 中 的 每 个 字 节 都 被 当 作 一 个 ASCII 字符 。 
序列 的 最 后 一 个 字 节 必须 是 全 0，STR0 把 它 作 为 一 个 标记 符号 。 这 条 指令 从 头 开始 输出 字 
节 字 符 串 ， 直 到 但 是 不 包括 标记 符号 。 在 图 5-12 中 ， 伪 操作 
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04000D BR 0x000D ;Branch around data 

0000 .BLOCK 2 :Storage for one integer 
202B20 .ASCII " + 1 = \x00" 

31203D 

2000 


310003 DECI 0x0003,d ;Get the number 
390003 DECO 0x0003,d sand output it 
410005 STRO 0x0005,d sOutput "+1 =" 
C10003 LDA 0x0003,d ;A <- the number 
700001 ADDA iai ;Add one to it 
£10003 STA 0x0003,d ;Store the sum 
390003 DECO 0x0003,d ;Output the sum 
00 STOP 

.END 


输入 
-479 
输出 
-479 + 1 = -478 





图 5-12 与 图 5-11 一 样 的 程序 ， 不 过 使 用 的 是 STRO 指令 


用 \x00 生成 这 个 标记 符号 字 节 。 这 个 伪 操 作 生 成 包括 标记 符号 在 内 的 8 字 节 ， 但 是 STRO 
指令 只 输出 7 字 节 。 在 计算 BR 指令 的 操作 数 时 ， 必 须 把 所 有 8 字 节 都 计算 在 内 。 

汇编 器 列表 只 在 目标 代码 栏 分配 了 3 字 节 的 空间 ， 如 果 .ASCII 伪 操 作 中 的 字符 串 生 成 
的 字 节 数 大 于 3， 那 么 汇编 硕 列 表 会 在 后 续 的 行 继续 目标 代码 。 


5.2.4 解释 位 模式 


第 4 草 和 第 5 草 从 低 的 抽象 层次 (ISA3 ) 讲 到 高 的 抽象 层次 (Asmb5 )。 虽 然 Asmb5 层 
的 汇编 语言 隐藏 了 机 器 语言 的 细节 ， 但 细节 仍然 存在 ， 尤 其 是 机 器 最 终 还 是 基于 取 指 、 译 
码 、 增 加 PC. TAT. BRINGS ' 诺 依 曼 执行 周期 。 用 伪 操作 和 助 记 符 来 产生 数据 位 和 指 
令 位 不 会 改变 机 器 的 属性 。 当 指令 执行 时 ， 它 只 是 执行 位 ， 并 不 知道 汇编 器 怎样 生成 这 些 
位 。 图 5-13 展示 了 一 个 无 实际 意义 的 程序 ， 它 的 唯一 目的 是 用 来 说 明 这 种 情况 。 它 用 一 种 
伪 操 作 来 产生 数据 位 ， 而 这 些 位 会 被 指令 以 一 种 意 想 不 到 的 方式 来 解释 。 

在 这 个 程序 中 ， 用 


-WORD OxFFFE ;First 


生成 了 First 的 十 六 进 制 值 ， 但 是 被 


DECO 0x0003,d ;Interpret First as decimal 


解释 成 一 个 十 进 制 数 ， 并 输出 -2。 当 然 ， 如 果 程 序 员 想 要 把 位 模式 FFFE 解释 为 十 进 制 数 ， 
他 也 许 会 写 这 样 的 伪 操作 


WORD -2 ;First 


这 个 伪 操作 生成 同样 的 目标 代码 ， 而 且 目 标 程序 与 原始 程序 相同 。 当 DECO 执行 时 ， 它 
不 知道 在 翻译 时 位 是 怎样 生成 的 ， 它 只 知道 在 执行 时 它们 是 什么 。 
十 进 制 输出 指令 


DECO 0x0005,d ;Interpret Second and Third as decimal 
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040009 BR 0x0009 ;Branch around data 
PRFE .WORD OxXFFFE sFirst 
00 . 0x00 ;Second 
"y" ‚Third 
0470 : 1136 ; Fourth 


390003 DECO 0x0003,d ; Interpret First as decimal 

50000A CHARO AM? A 

390005 DECO 0x0005,d ;Interpret Second and Third as decimal 
50000A CHARO AN ot 


510006 CHARO  0x0006,d ;Interpret Third as character 
510008 CHARO £0x0008,d ; Interpret Fourth as character 
00 STOP 

. END 





图 $-13 ”说 明 位 模式 解释 方式 的 无 实际 意义 程序 


把 位 于 地 址 0005 的 位 解释 为 一 个 十 进 制 数 ， 输 出 85. DECO 总 是 输出 两 个 连续 字 节 的 十 进 制 
值 。 这 种 情况 下 ， 字 节 0055 Chex) = 85 (dec)。 实 际 情况 是 这 2 字 市 是 由 两 个 不 同 的 .TYPE 
点 命令 生成 的 ， 一 个 是 从 十 六 进 制 常 量 0x00 生成 的 ， 而 男 一 个 是 从 字符 和 常量“ U” 生 成 的 ， 
而 这 些 都 没有 关系 。 在 执行 时 ， 唯 一 重要 的 是 位 是 什么 ， 而 不 是 它们 来 目 哪 里 。 

字符 输出 指令 

CHARO 0x0006,d ;Interpret Third as character 
把 地 址 0006 的 位 解释 为 一 个 字符 。 这 一 点 也 不 奇怪 ， 因 为 这 些 位 是 由 .BYTE 点 命令 用 一 个 
字符 常量 生成 的 。 和 预期 的 一 样 ， 输 出 了 字母 U。 

最 后 一 个 输出 指令 

CHARO 0x0008,d ;Interpret Fourth as character 
输出 字母 p。 为 什么 呢 ? 因为 存储 单元 0008 的 位 是 70 (hex), Ete ASCH 字符 p 对 应 的 位 。 
这 些 位 是 从 哪里 来 的 ? 它们 是 

.WORD 1136 ;Fourth 
生成 位 的 后 半 部 分 。 之 所 以 这 样 是 因为 1136 (dec) = 0470 (hex)， 而 这 个 位 模式 的 第 二 个 字 
节 是 70 (hex). 

在 所 有 这 些 例 子 中 ， 指 令 只 是 经 过 冯 “ 诺 依 曼 执行 周期 。 我 们 必须 牢记 翻译 过 程 不 同 于 
执行 过 程 ， 翻 译 在 执行 之 前 进行 。 翻 译 后 ， 当 指令 执行 时 ， 位 的 来 源 就 不 重要 了 。 唯 一 重要 
的 是 位 是 什么 ， 而 不 是 翻译 阶段 它们 是 从 哪里 来 的 。 


5.2.5 K CHR 


Are FR C Sa te A a ARER AR LA RA), OEE HI Pe PRY E — xp — BR 
(one-to-one mapping). — R W iain A a WARY E — RALA STA), SEE A a, 
稍 后 我 们 会 看 到 编译 程序 的 一 对 多 映射 。 

给 你 一 条 汇编 语言 语句 ， 总 是 可 以 确定 它 对 应 的 机 器 语言 语句 。 反 过 来 呢 ? 给 你 一 个 机 
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器 语言 程序 的 位 序列 ， 你 能 确定 这 条 机 器 语言 来 自 于 哪 条 汇编 语言 语句 吗 ? 

答案 是 : 不 ， 你 不 能 。 尽 管 汇 编 语言 到 机 器 语言 的 转换 是 一 对 一 的 ， 但 逆向 转换 却 不 是 
唯一 的 。 对 于 二 进 制 机 峰 语 言 序列 

0101 0111 
不 知道 汇编 语言 程序 员 原来 使 用 的 是 字符 由 的 汇编 器 指示 字 ， 还 是 使 用 栈 间接 相对 寻 址 方式 
的 CHARO 助 记 符 。 不 管 源 程序 中 是 这 两 条 汇编 语言 语句 中 的 哪 一 个 ， 汇 编 器 都 会 生成 完全 
一 样 的 位 序列 。 

此 外 ,在 执行 时 ， 主 存 不 知道 原始 的 汇编 语句 是 什么 ， 它 只 知道 CPU 通过 执行 周期 处 
理 的 1 和 0。 

图 5-14 给 出 了 生成 相同 机 器 语言 的 两 个 汇编 语言 程序 ， [aa 下 
因此 生成 的 输出 也 一 样 。 当 然 ， 严 谨 的 程序 员 不 会 写 出 第 二 | 一 一 一 一 

0000 51000A CHARO 0x000A,d 
个 程序 ， 因 为 它 比 第 一 个 程序 难 理解 多 了 。 0003 51000B CHARO  0x000B,d 
因为 有 伪 操 作 ， 所 以 反 汇编 映射 不 是 唯一 的 。 如 果 没 有 | 0006 51000C CHARO 0x000C,d 
伪 操 作 ， 从 二 进 制 目标 代码 还 原 出 原始 汇编 语言 语句 就 会 只 9002 OEE ASCII "Pun" 
有 一 种 可 能 的 形式 。 伪 操作 用 来 把 数据 位 ， 而 不 是 指令 位 ， | 0000 .END 
插入 内 存 中 。 数 据 和 程序 共享 内 存 是 反 汇 编 映 射 不 唯一 的 主 | 汇编 语言 程序 
要 原因 。 0000 51000A CHARO 0x000A,d 

对 于 软件 开发 者 来 说 ， 从 目标 程序 恢复 源 程序 很 困难 one ee CA ox000c A 
是 一 个 有 利于 市 场 的 好 处 。 如 果 用 汇编 语言 写 了 一 个 应 用 程 | 0009 00 STOP 
序 ， 你 有 两 种 方式 销售 它 : 一 种 是 卖 源 程序 ， 让 客户 对 它 进 | 000A 50756E CHARO 0x756E ,i 
行 汇编 ， 那 么 客户 就 拥有 源 程序 和 目标 程序 ， 一 种 是 你 自己 | ii 
汇编 ， 仅 出 售 目标 程序 。 le 

采用 这 两 种 方式 ， 客 户 都 有 执行 应 用 程序 所 必需 的 目 [之 
标 程序 。 但 是 如 果 客 户 也 有 源 程序 ， 他 就 可 以 很 容易 地 修改 图 5-14 两 个 产生 相同 目标 程序 从 
源 程序 以 适应 他 自己 的 目的 。 他 甚至 只 需 稍微 费 点 儿 功夫 就 而 产生 相同 输出 的 源 程序 
可 以 改进 这 个 源 程序 ， 把 它 作为 一 个 增强 版 来 销售 ， 并 和 你 形成 直接 竞争 。 修 改 机 器 语言 
序 就 会 困难 很 多 。 因 此 为 了 防止 客户 自 改 程序 ， 大 多 数 商 业 软 件 产 品 只 出 售 目标 代码 形式 的 
产品 。 

开源 软件 运动 是 计算 机 工业 近来 的 一 个 发 展 。 这 个 理念 是 由 于 支持 的 问题 ， 客 户 拥有 源 
程序 是 有 益 的 。 如 果 只 有 目标 程序 ， 那 么 在 发 现 了 需要 修补 的 漏洞 ， 或 者 发 现 了 一 个 需要 增 
加 的 特性 时 ， 必 须 等 待 卖 给 你 软件 的 公司 修补 漏洞 或 增加 特性 。 如 果 拥 有 源 程序 ， 就 可 以 自 
己 修改 使 之 适合 你 自己 的 需要 。 有 些 开源 公司 确实 免费 提供 源 代码 ， 通 过 为 产品 提供 软件 支 
持 获 得 收入 。 采 用 这 种 策略 的 一 个 例子 是 Linux 操作 系统 ， 它 可 以 免费 从 因特网 获得 。 尽 管 
这 样 的 软件 是 免费 的 ， 但 是 使 用 它 需 要 有 较 高 水 平 的 技能 。 

反 汇 编 器 (disassembler) 是 一 个 试图 从 目标 程序 恢复 源 程序 的 程序 。 因 为 反 回 汇编 硕 映 
射 的 非 唯一 性 ， 所 以 反 汇编 器 不 一 定 能 100% 成 功 。 本 章 中 的 程序 把 数据 放 在 指令 的 前 面 或 
者 指令 的 后 面 。 在 大 的 程序 中 ， 数 据 部 分 的 放置 通常 会 贯穿 程序 ， 这 就 使 得 在 目标 程序 中 辨 
别 指令 位 和 数据 位 很 困难 。 反 汇编 器 能 够 读 取 每 个 字 节 并 数 次 输出 它 一 一 一 次 解释 为 指令 指 
示 符 ,一 次 解释 为 ASCII 字符 ， 一 次 解释 为 二 进 制 补 码 表示 的 整数 等 。 然 后 ， 人 们 可 以 学 
试 去 重 构 源 程序 ， 但 这 个 过 程 非常 单调 乏味 。 
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5.3 FS 


前 面 一 节 介 绍 了 转移 指令 BR， 用 来 绕 开 程序 开头 的 数据 。 尽 管 这 个 技术 减轻 了 手工 确 
定数 据 单 元 地 址 的 问题 ， 但 它 不 能 完全 消除 这 个 问题 。 仍 然 必须 通过 十 六 进 制 计 数 来 确定 这 
些 数据 单元 的 地 址 ， 如 果 数 据 单元 数量 很 大 ， 就 可 能 出 错 。 而 且 ， 如 果 想 修改 数据 部 分 ， 比 
如 删除 一 条 .WORD 命令 ， 这 条 删除 的 指令 后 面 的 所 有 数据 单元 的 地 址 都 将 会 改变 。 这 样 就 
必须 修改 所 有 引用 了 这 些 修改 过 的 地 址 的 指令 。 

汇编 语言 符号 可 以 消除 手工 确定 地 址 的 问题 。 类 似 于 C++ 的 标识 符 ， 汇 编 器 让 一 个 符 
号 ( symbol) 和 一 个 内 存 地 址 关联 起 来 。 在 程序 中 任何 需要 引用 这 个 地 址 的 地 方 ， 都 可 以 引 
用 这 个 符号 。 如 果 通 过 增加 或 删除 语句 修改 程序 ， 那 么 当 汇 编 这 个 程序 时 ， 汇 编 器 将 计算 和 
这 个 符号 相关 联 的 新 地 址 ， 这 样 就 不 需要 重 写 通 过 符号 引用 了 被 改变 的 地 址 的 语句 。 


5.3.1 带 符 号 的 程序 
图 5-15 的 汇编 语言 生成 的 目标 代码 和 图 5-12 中 的 一 样 。 它 使 用 了 3 个 符号 ,num、msg 


和 main。 
汇编 器 列表 
Addr Code Symbol Mnemon Operand Comment 
0000 04000D main :Branch around data 
0003 0000 num: ‘ 2 ;Storage for one integer 
0005 202B20 msg: ; "+ 1 = \x00" 
31203D 
2000 


000D 310003 main: DECI ;Get the number 
0010 390003 DECO sand output it 
0013 410005 STRO sOutput ' + 1 = ’ 
0016 C10003 LDA ;A <- the number 
0019 700001 ADDA 93 ;Add one to it 
001C E10003 STA ;Store the sum 
001F 390003 DECO ;Output the sum 
0022 00 STOP 

0023 .END 


Symbol table: 

Symbol Value 
main 000D 
msg 0005 
num 0003 


输入 
-479 


输出 
-479 + 1 = -478 





图 5-15 一 个 计算 十 进 制 值 加 1 的 程序 。 除了 使 用 符号 之 外 ， 其 他 的 部 分 与 图 5-12 相同 


符号 的 语法 规则 类 似 于 C++ 标识 符 的 语法 规则 ， 第 一 个 字符 必须 是 字母 ， 接 下 来 的 字 
符 必 须 是 字母 或 数字 。 符 号 的 长 度 最 多 是 8 个 字符 ， 并 且 是 区 分 大 小 写 的 。 例 如 ，Number 
和 number 是 不 同 的 符号 ， 因 为 大 写字 母 N 和 小 写字 母 n 是 不 同 的 。 
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可 以 通过 把 它 放 在 任何 一 个 汇编 语言 行 的 前 面 来 定义 一 个 符号 。 当 定义 了 一 个 符号 时 ， 
必须 用 冒号 : 来 结束 ， 最 后 一 个 字符 和 冒号 之 间 不 能 有 空格 。 在 这 个 程序 中 ， 语 名 

num: .BLOCK 2 ;Storage for one integer 

除了 分 配 了 一 个 2 字 节 的 块 以 外 ， 还 定义 了 一 个 字符 num。 这 一 行 中 ， 冒 号 和 伪 操作 之 
间 有 空格 , 但 是 汇编 右 并 不 要 求 一 定 要 有 空格 。 

当 汇 编 融 检测 到 符号 定义 时 ， 就 会 在 符号 表 中 存储 这 个 符号 和 它 的 值 。 这 个 值 是 内 存 中 
该 行 生 成 的 目标 代码 的 第 一 个 字 节 将 要 被 装 人 的 地 址 。 如 果 在 程序 中 定义 了 一 些 符 号 ， 那 么 
汇编 右 列 表 会 输出 一 个 符号 表 ， 其 中 的 值 以 十 六 进 制 表示 。 图 5-15 展示 了 这 个 程序 的 符号 
表 输 出 。 从 表 中 可 以 看 到 符号 num 的 值 是 0003 (hex). 

当 引 用 符号 时 ， 不 能 包括 冒号 。 语 句 


LDA num,d ;A <- the number 


引用 了 符号 num. AWA num 的 值 是 0003 (hex)， 所 以 这 条 语句 生成 的 代码 和 语句 


LDA 0x0003,d ;A <- the number 


生成 的 代码 一 样 。 类 似 地 ， 因 为 main 的 值 是 000D (hex)， 所 以 语句 
BR main ;Branch around data 


生成 的 代码 和 语句 


BR Ox000D ;Branch around data 


生成 的 代码 是 一 样 的 。 

注意 ， 符 号 的 值 是 地 址 ， 而 不 是 那个 地 址 单元 的 内 容 。 当 程序 执行 时 ，Mem[0003] 将 包 
含 -479 (hex)， 它 取 目 输入 设备 。num 的 值 仍然 是 0003 ( hex)， 而 不 是 -479， 这 两 者 是 不 
同 的 。 可 以 把 符号 的 值 想 象 成 来 自 于 汇编 器 列表 中 包含 该 符号 定义 的 那 一 行 的 地 址 栏 。 

符号 不 仅 把 人 们 从 手工 计算 地 址 的 负担 中 解脱 出 来 ， 而 且 也 使 程序 更 易 读 。 在 视觉 上 ， 
num 比 0x0003 更 易 读 。 优 秀 的 程序 员 会 非常 细心 地 为 他 们 的 程序 挑选 有 意义 的 符号 来 增加 
程序 的 可 读 性 。 


5.3.2 一 个 冯 … 诺 依 曼 示例 


当 在 Asmb5 层 用 符号 编程 时 ， 很 容易 忘记 计算 机 的 冯 … 诺 依 曼 本 质 。 两 个 经 典 的 
冯 “ Akm (把 指令 当 作 数 据 操作 和 把 数据 当 作 指令 来 执行 ) 仍然 存在 。 
例如 ， 思 考 下 面 的 汇编 语言 程序 : 


this: DECO this ,d 
STOP 
.END 


你 可 能 认为 汇编 融会 拒绝 第 一 条 指令 ， 因 为 它 看 上 
去 在 把 它 自己 当 作 数 据 进行 引用 ， 这 貌似 没有 意义 。 但 | THEIR 


是 汇编 器 不 会 往 前 看 执行 的 结果 。 因 为 语法 是 正确 的 ，| 0000 390000 this: Deco this.a 


0003 00 STOP 


所 以 它 相应 地 进行 翻译 图 5-16 所 示 的 汇编 器 列表 所 示 。 0004 END 
在 执行 期 间 ，CPU 把 39 看 作 采 用 直接 寻 址 的 十 进 | 输出 | 

制 输出 指令 的 操作 码 ， 把 Mem[0000] 的 字 3900 (hex) 

看 作 十 进 制 数字 ， 并 输出 它 的 值 14 952. 图 5-16 ”说 明 机 器 底层 汉 “' REA 
认识 到 计算 机 硬件 没有 天 生 的 智能 也 没有 推理 能 力 质 的 没有 实际 意义 的 程序 
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是 很 重要 的 。 执 行 周期 和 指令 集 固 化 在 CPU 中 。 就 像 这 个 程序 说 明 的 那样 ，CPU 不 知道 它 
处 理 的 位 历史 ， 它 没有 总 体 图 ， 它 只 是 一 壳 又 一 人 壳 地 执行 冯 : 诺 依 曼 循环 。 主 存 也 是 这 样 
的 ， 它 不 知道 它 存储 过 的 位 历史 ， 它 只 是 根据 CPU 的 命令 存储 1 和 0。 任 何 智 能 或 推理 能 
力 都 来 自 于 软件 ,而 软件 是 人 写 的。 


5.4 从 HOL6 RMF 


编译 器 把 高 级 语言 (HOL6 层 ) 程序 转换 为 较 低 级 语言 的 程序 ， 最 终 程序 能 被 机 器 执行 。 
有 些 编译 器 直接 翻译 成 机 器 语言 (ISA3 层 )， 
如 图 5-17a 所 示 ， 这 样 程序 就 可 以 装 人 内 存 并 
执行 。 另 一 些 编译 需 翻 译 成 汇编 语言 ( Asmb5 
层 )， 如 图 5-17b 所 示 ， 接 下 来 必须 由 汇编 大 把 
汇编 语言 程序 再 翻译 成 机 絮语 言 ， 然 后 才能 装 
入 和 执行 。 

与 汇编 句 一 样 ， 编 译 吉 也 是 一 个 程序 。 它 
必须 像 其 他 程序 一 样 地 编写 和 调试 。 编 译 项 的 
输入 叫 作 源 程 序 ， 不 管 输出 是 机 器 语言 还 是 汇 
编 语言 都 叫 作 目标 程序 。 这 和 汇编 右 的 输入 / 
输出 术语 是 一 样 的 。 

本 节 讲 述 从 C++ 到 Pep/8 汇编 语言 的 翻译 
过 程 。 它 展示 编译 希 怎 样 翻译 cin, cout FIIR 
值 语 句 ， 以 及 它 是 怎样 在 C++ 层 实施 类 型 (type) 
的 概念 。 第 6 章 将 继续 讨论 高 级 语言 层 ( HOL6 
层 ) 和 汇编 语言 层 (Asmb5 JZ) 之 间 的 关系 。 a) 直接 翻译 成 机 器 语言 b) 翻译 成 汇编 语言 


5.4.1 cout 语句 图 5-17 ”编译 器 的 功能 


图 5-18 中 的 程序 展示 了 编译 器 怎样 把 一 个 aad 
` ’ » ʻa 
简单 的 、 只 有 一 条 输入 语句 的 C++ 程序 翻译 成 | 一 。， 
、 een include <iostream> 
汇编 语言 。 using namespace std; 


编译 器 把 C++ 语句 int main () { 


cout << "Love" << endl; 
return 0; 





cout << "Love" << endl; 


翻译 为 两 条 可 执行 的 汇编 语句 


STRO msg,d 汇编 语言 
CHARO ‘\n’,i 0000 410007 STRO msg,d 
0003 CHARO "NM 

一 个 占 从 分 
和 | 点 命令 0006 STOP 
msg: .ASCII “Love\x00" 0007 4C6F76 msg: .ASCII “Love\x00" 

X» S 全 “ ?9 6500 

STRO 语句 对 应 TRZ Love 到 | cout, 000C .END 


CHARO 指令 对 应 于 发 送 endl 到 cout。 这 是 一 
个 一 对 三 映射 。 与 汇编 右 相 比 ， 编 译 融 的 映射 通 
常 不 是 一 对 一 的 ， 而 是 一 对 多 的 。 这 个 程序 和 后 
面 的 所 有 程序 都 把 字符 串 稼 量 放 在 程序 的 底部 。 图 5-18 HOL6 层 和 Asmb5 Jeff cout 语句 


输出 
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对 应 于 变量 值 的 数据 放 在 程序 的 顶部 ， 对 应 于 它们 在 HOL6 程序 中 的 放置 位 置 。 

编译 需 把 C++ 语句 

return 0; 
翻译 为 汇编 语言 语句 

STOP 

除了 main() 之 外 C++ 函数 的 return 语句 不 翻译 为 STOP。 这 个 对 main() 的 return 的 
翻译 是 一 个 简化 。 实 际 的 C++ 编译 器 必须 生成 在 特定 操作 系统 上 执行 的 代码 。 由 操作 系统 
来 解释 main() 因数 的 返回 值 。 通 常 的 惯例 是 返回 值 0 表示 程序 的 执行 没有 发 生 错 误 ; 如 
宁 发 生 了 错误 ， 程 序 返 回 某 个 非 零 值 ， 但 是 这 种 情况 下 会 发 生 什 么 取决 于 具体 的 操作 系统 。 
在 Pep/8 系统 中 ， 从 main 的 返回 对 应 于 终止 程序 ， 因 此 从 main() 返回 将 总 是 被 翻译 成 
STOP。 第 6 章 将 展示 编译 器 怎样 翻译 main() 之 外 的 其 他 函数 的 return. 

C++ 程序 的 其 他 部 分 甚至 直接 不 转换 。 例 如 ， 


#include <iostream> 
using namespace std; 


根本 不 会 在 汇编 语言 程序 中 出 现 。 实 际 的 C++ 编译 器 会 用 include 和 using 语句 生成 到 操作 系 
统 和 它 库 的 正确 接口 。 因 为 这 里 我 们 只 做 简单 的 介绍 ， 所 以 Pep/8 系统 会 忽略 这 种 细节 。 

图 5-19 展示 了 编译 这 个 程序 的 编译 器 的 输入 和 输出 。(a) 部 分 是 直接 翻译 为 机 咒语 言 
编译 副 ， 目 标 程序 可 以 装 入 和 执行 。(b) 部 分 是 翻译 为 Asmbs 层 汇 编 语 言 的 编译 器 ， 在 装 人 
和 执行 前 ， 还 需要 汇编 为 目标 程序 。 

输入 处 理 输出 


#include <iostream> 
3 41 00 07 50 00 OA 00 
PEA 4C 6F 76 65 00 zz 


using namespace std; 
a) 直接 翻译 成 机 器 语言 的 编译 器 











int main () { 
cout << "Love" << endil; 
return 0; 

} 












#include <iostream> 
using namespace std; 

int main () { 

cout << "Love" << endl; 
return 0; 


STRO msg,d 
CHARO '\n',i 
STOP 


msg: .ASCII"Love\x00" 
. END 





b) 翻译 成 汇编 语言 的 编译 器 
图 5-19 ”编译 器 对 图 5-18 中 的 程序 所 做 的 行为 


5.4.2 ”变量 和 类 型 


每 个 C++ 变量 有 3 个 属性 一 一 变量 名 、 变 量 类 型 和 变量 值 。 对 每 个 声明 的 变量 ， 编 译 
器 在 机 器 语言 程序 中 会 保留 一 个 或 多 个 存储 单元 。 高 级 语言 中 的 变量 在 低级 语言 中 就 只 是 一 
个 存储 单元 。HOL6 层 程 序 通过 名 字 ( 即 C++ 标识 符 ) 引用 变量 ， 而 ISA3 层 程序 通过 地 址 
引用 它们 。 变 量 值 是 与 C++ 标识 符 相 关联 的 地 址 处 的 存储 单元 的 值 。 

编译 器 必须 记 住 哪个 地 址 对 应 HOL6 层 程序 中 的 哪个 变量 名 ， 它 用 一 个 符号 表 来 建立 变 
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量 名 和 地 址 之 间 的 关联 。 

编译 絮 的 符号 表 类 似 于 汇编 程序 的 符号 表 , 但 是 内 在 要 复杂 得 多 。C++ 中 的 变量 名 没有 
限制 为 最 多 8 个 字符 ， 而 Pep/8 中 的 符号 有 这 个 限制 。 此 外 ， 编 译 器 的 符号 表 必 须要 存储 变 
量 类 型 以 及 它 的 关联 地 址 。 

直接 翻译 为 机 需 语 言 的 编译 器 不 需要 用 汇编 器 进行 二 次 翻译 。 图 5-20a 展示 了 这 样 一 个 
编译 需 的 符号 表 产 生 的 映射 。 不 过 ， 本 书 中 的 程序 说 明了 一 个 翻译 为 汇编 语言 的 、 假 设 的 编 
译 需 的 翻译 过 程 ， 因 为 汇编 语言 比 机 器 语言 更 易 读 。C++ 变量 名 对 应 于 Pep/8 汇编 语言 的 符 
号 ， 如 图 5-20b 所 示 。 

C++ 的 变 内 存 C++ 的 变 
量 名 标识 符 地 址 量 名 标识 符 
a) 直接 翻译 成 机 咒语 言 的 编译 器 b) 一 个 用 以 说 明 目 的 的 假想 的 编译 器 
图 5-20 ”编译 器 在 HOL6 层 变量 和 ISA3 层 存 储 位 置 之 间 所 做 的 映射 


图 5-20b 中 的 对 应 关系 ， 对 于 翻译 为 汇编 语言 的 编译 器 来 说 是 不 太 实 际 的 。 设 想 一 个 有 
两 个 变量 discountRatel 和 discountRate2 的 C++ 程序， 因为 这 两 个 变量 的 长 度 都 大 于 
8 个 字符 ， 所 以 编译 器 很 难 把 这 两 个 标识 符 映 射 到 各 自 唯 一 的 Pep/8 符号 。 为 了 使 C++ 和 
汇编 语言 之 间 的 对 应 关系 清晰 ， 我 们 的 例子 会 把 C++ 标识 符 限 制 为 最 多 8 个 字符 。 真 实 的 、 
翻译 到 汇编 语言 的 编译 器 通常 不 会 对 变量 名 使 用 汇编 语言 符号 。 


54.3 全 局 变量 和 赋值 语句 


图 5-21 中 的 C++ 程序 来 目 图 2-4。 它 给 出 了 HOL6 层 的 全 局 变量 的 赋值 语句 和 相应 的 
汇编 语言 程序 。 这 里 的 目标 程序 包含 注释 ， 但 是 实际 的 编译 器 不 会 产生 注释 ， 因 为 人 类 程序 
员 通 常 不 需要 读 目 标 程序 。 





高 级 语言 


#include <iostream> 
using namespace std; 


char ch; 
HE J: 


int main () { 
cin >> ch >> J- 
j te 55 
Ch++; 
cout << ch << endl << j << endl; 
return 0; . 
} 


汇编 语言 
040006 


;global variable #1c 
;global variable #2d 


490003 main: CHARI :cin >> ch 
310004 DECI : >> j 


图 5-21 HOL6 层 和 AsmbS 层 的 全 局 变量 赋值 语句 。 该 C++ 程序 来 自 图 2-4 
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C10004 
700005 
E10004 
D10003 LDBYTEA ch ,d 
700001 ADDA 1,i 
F10003 STBYTEA ch,d 
510003 CHARO ch,d ;cout << ch 
50000A CHARO  '\n',i ; << end] 
390004 DECO j.d ; << 3 
50000A CHARO ‘\n",i ; << end] 
00 STOP 

.END 





图 5-21 ( 续 ) 


记 住 编译 副 是 一 个 程序 ， 它 必须 像 其 他 程序 一 样 进行 编写 和 调试 。 一 个 翻译 C++ 程序 
的 编译 龙 可 以 用 任何 语言 来 编写 一 一 其 至 C++ ! 下 面 的 程序 段 说 明了 这 个 交错 的 状态 。 它 
是 把 C++ 源 程 序 翻译 成 汇编 语言 目标 程序 的 简化 编译 器 的 一 部 分 。 
typedef int HexDigit; 
enum KindType {sInt, sBool, sChar, sFloat}; 
struct SymbolTableEntry { 
char symbol[32]; 
HexDigit value[4]; 
KindType kind; 
E 


SymbolTableEntry symbolTable[100]; 


符号 表 中 的 一 个 条 目 包含 三 部 分 一 一 符号 本 身 ; 它 的 值 ， 即 Pep/8 内 存 中 存储 变量 值 的 
地 址 ; 存储 的 值 的 种 类 ， 即 变量 的 类 型 。 
图 5-22 展示 了 这 个 程序 符号 表 中 的 条 目 。 第 一 个 变量 的 符号 名 是 cn， 编译 器 通过 生 
成 .BLOCK 命令 在 Mem[0003] 分 配 1 字 节 ， 在 符号 表 中 把 它 的 类 型 存储 为 schar ， 表 明 这 
个 变量 是 一 个 C++ 字符。 第 二 个 变量 的 符号 名 是 j， 编 译 器 为 这 个 值 在 Mem[0004] 处 分 配 
2 字 节 ， 把 它 的 类 型 存储 为 sInt， 表 明 是 一 个 C++ a. 编译 器 从 C++ 程序 的 变量 声明 得 
出 变量 类 型 。 





在 代码 生成 阶段 ， 编 译 器 把 符号 类 型 

cin >> èn 2? js 
翻译 为 

CHARI 0x0003 ,d : i 

DECI 0x0004, d 图 5-22 一 个 假想 的 编译 器 翻译 图 5.21 
编译 的 前 一 阶段 会 填充 符号 表 ， 此 时 ， 编 译 器 会 查阅 所 示 程 序 时 的 符号 表 


符号 表 来 确定 CHARI 和 DECI 指令 操作 数 的 地 址 。 如 同 之 前 解释 过 的 ， 为 了 易 读 性 ， 代 码 中 
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会 把 生成 的 指令 写作 
CHARI ch ,d 
DECI jd 


注意 ， 存 储 在 符号 表 中 的 值 并 不 是 执行 期 间 变量 的 值 ， 而 是 存储 值 的 内 存 地 址 。 如 果 执 
行 时 用 户 给 j 输入 419， 那 么 存储 在 Mem[0004] 的 值 将 是 01A3 (hex), Bl 419 (dec) 的 二 
进 制 表 示 。 在 翻译 时 ， 符 号 表 中 符号 j 的 值 是 0004 而 不 是 01A3。 在 翻译 时 C++ 变量 值 是 
不 存在 的 ， 它 们 只 存在 于 执行 时 。 

在 HOL6 层 给 一 个 变量 赋值 对 应 于 在 Asmb5 层 把 值 存储 到 内 存 。 编 译 器 把 赋值 语句 


j + 5; 
翻译 成 
LDA j,d 
ADDA 5,7 
STA 3,4 
LDA 和 ADDA 执行 赋值 语句 右边 的 计算 ， 把 计算 结果 放 在 累加 器 中 。STA 把 计算 结果 再 赋值 
给 j。 
这 个 赋值 语句 说 明了 存 取 全 局 变量 的 一 般 规则 : 
e 变量 的 符号 是 值 的 地 址 。 
e 用 直接 寻 址 方式 访问 值 。 
在 本 例 中 ， 全 局 变量 符号 j 是 地 址 0004, LDA 和 STA 语句 使 用 直接 寻 址 方式 。 
ZEW, BaP REE 
ch++ 
翻译 为 
LDBYTEA ch ,d 
ADDA 1,i 


STBYTEA ch,d 
与 j 加 5 相同 的 指令 ，ADDA， 对 ch 执行 增 量 运算 ， 同 样 ， 因 为 ch 是 全 局 变量 ， 所 以 它 的 
值 是 地 址 0003, LDBYTEA 和 STBYTEA 指令 使 用 直接 寻 址 方式 。 

编译 器 把 

cout << ch << endl << j << endl; 
翻译 为 

CHARO ch ,d 

CHARO ‘\n',7 


DECO jg 
CHARO “Nn 到 


用 直接 寻 址 输出 全 局 变量 ch 和 j 的 值 。 

编译 器 必须 搜索 符号 表 来 建立 像 ch 这 样 的 符号 和 它 的 地 址 0003 之 间 的 关联 。 符 号 表 
是 一 个 数组 。 如 果 它 不 按照 符号 名 的 字母 顺序 维护 ， 那 么 要 在 表 中 定位 ch 就 需要 进行 顺序 
搜索 ; 如 果 符 号 名 按照 字母 顺序 排序 ， 那 么 就 可 以 使 用 二 分 查找 。 


5.4.4 类 型 兼容 
为 了 了 解 在 HOL6 层 是 怎样 保证 类 型 兼容 的 ， 假 设 一 个 C++ 程序 中 有 两 个 变量 ， 整 型 
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j 和 浮 点 型 y。 同 时 假定 有 一 台 不 同 于 Pep/8 的 计算 机 ， 它 可 以 存储 和 处 理 浮 点 型 值 ， 就 叫 
He Pep/99 吧 。 浮 点 型 数 的 二 进 制 编码 方式 不 同 于 整数 的 编码 方式 ， 它 们 以 二 进 制 科学 表示 
法 存储 ， 指 数 部 分 和 尾数 部 分 分 开 存储 在 不 同 的 单元 中 。 你 程序 的 编译 器 符号 表 可 能 会 看 上 
去 像 图 5-23。 

现在 来 考虑 C++ 中 的 运算 j%8。% 是 模 运 算 符 ， 只 限于 符号 类 型 
对 整数 值 进行 运算 。 在 二 进 制 中 执行 j%8， 就 是 把 除了 最 右 Il j | 0003 | smt | 
边 3 位 以 外 的 所 有 其 他 位 都 置 为 0。 例如， 如 果 j 的 值 是 61 [| y | 000s | sFloat_ 
(dec) = 0011 1101 (bin)， 那 么 j%8 的 值 是 5 (dec) = 0000 B| : : 
0101(bin)， 就 是 把 除了 最 右边 3 位 外 的 所 有 其 他 位 都 置 为 0。 图 5-23 Pep/99 编译 器 的 符号 表 

假定 你 的 C++ 程序 中 有 下 面 的 语句 : 

J= Jj 8 

编译 器 会 查阅 符号 表 并 确定 变量 j 的 kind 是 sInt， 同 时 识别 8 是 一 个 整 型 常量 并 确 
定 % 运 算是 合法 的 ， 接 着 它 将 生成 目标 代码 


LDA j.d 
ANDA 0x0007,71 
STA j,d 


现在 假设 你 的 C++ 程序 中 有 下 面 的 语句 : 

y= y %8; 

编译 器 会 查阅 符号 表 并 确定 变量 y 的 kind 是 sFloat， 它 确定 % 运 算是 不 合法 的 ， 
为 该 运算 仅 适 用 于 整 型 类 型 。 它 将 生成 出 错 信息 

error: float operand for % 


而 不 会 生成 目标 代码 。 然 而 如 果 没 有 类 型 检测 ， 将 会 生成 下 面 的 代码 : 





LDA y.d 
ANDA 0x0007,i 
STA y.d 


虽然 执行 它 不 会 生成 有 意义 的 结果 ,但 实际 上 也 确实 没有 什么 能 阻止 汇编 语言 程序 员 写 
出 这 样 的 代码 。 

让 编译 右 检 测 类 型 的 兼容 性 有 巨大 作用 。 它 可 以 防止 编写 无 意义 的 语句 ， 例 如 对 浮 点 型 变 
量 执行 % 运 算 。 当 在 Asmb5 层 直 接 用 汇编 语言 编程 时 ， 没 有 类 型 兼容 检测 。 所 有 数据 都 是 由 
位 组 成 的 。 当 由 于 不 正确 的 数据 移 位 导致 漏洞 出 现时 ， 只 能 在 运行 时 而 不 能 在 翻译 时 检测 它们 。 
也 就 是 说 , 它们 是 逻辑 错误 而 不 是 语法 错误 。 众 所 周知 ， 逻 辑 错误 比 句 法 错误 更 难以 定位 。 


5.4.5 ”Pep/8 符号 跟踪 器 


对 应 于 C++ 内 存 模型 的 3 个 部 分 ，Pep/8 有 3 种 符号 跟踪 特性 一 一 用 于 全 局 变量 的 全 局 
跟踪 器 ; 用 于 参数 和 局 部 变量 的 栈 跟踪 器 ; 用 于 动态 分 配 变量 的 堆 跟踪 器 。 为 了 跟踪 一 个 变 
量 ， 程 序 员 把 跟踪 标签 骨 人 与 此 变量 相关 的 注释 中 ， 并 单 步调 试 程序 。Pep/8 的 集成 开发 环 
境 会 显示 变量 的 运行 时 值 。 

有 两 种 跟踪 标签 : 

e 格式 跟踪 标签 

e 符号 跟踪 标签 
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跟踪 标签 放 在 汇编 语言 注释 中 ， 对 生成 的 目标 代码 没有 影响 。 每 个 跟踪 标签 以 # 字 符 开 
始 ， 向 符号 跟踪 器 提供 在 跟踪 窗口 中 如 何 格 式 化 和 标记 存储 单元 的 信息 。 在 汇编 代码 时 ， 跟 
踪 标 签 出 错 会 作为 警告 ， 允 许 程序 继续 执行 ， 只 是 跟 踊 功能 关闭 了 。 如 果 不 纠 正 错 误 ， 就 一 
直 无 法 跟踪 。 

全 局 跟踪 器 允许 用 户 指 定 跟 踊 哪个 全 局 符号 ， 只 需要 在 声明 全 局 变量 的 .BLOCK 行 的 注 
释 中 放 一 个 格式 跟踪 标签 。 例 如 ， 图 5-21 中 的 这 两 行 ， 


ch: .BLOCK 1 ;global variable #1c 
j: .BLOCK 2 ;global variable #2d 


包含 格式 跟踪 标签 #1c 和 #2d。 第 一 个 格式 跟踪 标签 可 以 解读 为 “1 字 节 ， 字 符 。” 这 个 跟 
踪 标签 让 符号 跟踪 器 把 符号 ch 本 身 和 符号 值 指定 的 地 址 处 的 1 字 节 存储 单元 的 内 容 一 起 显 
示 出 来 。 类 似 地 ， 第 二 个 跟踪 标签 让 符号 跟踪 器 显示 j 指定 的 地 址 处 的 2 字 节 单元 ， 把 单元 
的 内 容 当 作 一 个 十 进 制 整数 。 

跟踪 标签 的 合法 格式 是 

Hie 1 字 节 字符 

#1d 1 字 节 十 进 制 

#2d 2 字 节 十 进 制 

Hih 1 字 节 十 六 进 制 

#2n 2 字 节 十 六 进 制 

全 局 变量 不 要 求 使 用 符号 跟踪 标签 ， 因 为 Pep/8 符号 跟踪 器 会 从 放置 跟踪 标签 
的 .BLOCK 行 获取 该 符号 。 但 是 局 部 变量 要 求 使 用 符号 跟踪 标签 ， 这 将 在 第 6 章 中 讲述 。 


5.4.6 ”算术 移 位 和 循环 移 位 指令 


Pep/8 有 两 个 算术 移 位 指令 和 两 个 循环 移 位 指令 。 这 4 条 指令 都 是 一 元 指令 ， 它们 的 指 
令 指示 符 、 助 记 符 和 所 影响 的 状态 位 如 下 所 示 : 

0001 110r ASLr 算术 左 移 r NZVC 

0001 Illir ASRr 算术 右 移 T NZC 

0010 000r ROLr 循环 左 移 r 本 

0010 001r RORr MARAH r D 

算术 移 位 和 循环 移 位 指令 没有 操作 数 指 示 符 。 每 条 指令 根据 r 的 值 决定 作用 于 累加 器 还 
是 变 址 寄存 器 。 如 第 3 章 所 述 ， 算 术 左 移 是 有 符号 整数 乘 以 2， 算术 右 移 是 有 符号 整数 除 以 
2。 循 环 左 移 是 每 位 往 左 移动 1 位 ， 最 高 有 效 位 移 到 CC 位 ，C 位 移 到 最 低 有 效 位 ; 循环 右 移 
是 每 位 往 右 移动 1 位 ， 最 低 有 效 位 移 到 C 位 ，C 位 移 到 最 高 有 效 位 。 

ASLr 指令 的 寄存 絮 传 送 语 言 (RTL) 描述 是 

C < r<0>, r<0..14> < r<1..15>, r<15> 二 0 

Nor<0 Zr=0V<1 游 出》 

ASRr 指令 的 RTL 描述 是 

和 

ROLr 指令 的 RTL 描述 是 

C 二 r<0>, r<0..14> + r<1..15>, r<15> + C 


RORr 指令 的 RTL 描述 是 


146 BORD LRA (ZSA) 


Ceria el dS *— TO 14>, 20> — C 
例 5.4 假定 要 执行 指令 的 十 六 进 制 形 式 为 IE， 图 5-24 是 它 的 二 进 制 表 示 。 操 作 码 表 
明 将 执行 ASRr 指令 ， 寄 存 器 r 字段 表明 指令 将 作用 于 累加 器 。 
图 5-25 展示 了 假设 累加 器 的 初始 内 容 为 0098 (hex) = 152 (dec) 时 ， 执 行 ASRA 指令 
的 结果 。ASRA 指令 将 位 模式 改变 为 004C (hex) = 76 (dec)， 这 个 值 是 152 的 一 半 。 因 为 累 
加 器 中 的 数 为 正 ， 所 以 N 位 为 0 ; 因为 累加 器 不 为 全 0， 所 以 Z 位 为 0 ; 因为 位 移 前 最 低 有 


效 位 为 0， 所 以 C 位 为 0。 口 
CPU 


指令 指示 符 操 作 码 





l E a) 之 前 b) 之 后 
图 5-24 ASRA 指令 图 5-25 ASRA 指令 的 执行 































Atanasoff、Mauchly 和 Eckert 

确定 现代 计算 机 的 缔造 者 是 一 个 很 复杂 的 问题 。 我 们 
必须 承认 这 样 一 些 做 出 贡献 的 人 和 事 ， 比 如 古代 中 国 的 算 
盘 、19 世纪 Charles Babbage 的 分 析 引 擎 、Lovelace 女士 对 
计算 的 思考 ， 但 是 我 们 搜寻 的 真正 目标 是 电子 数字 计算 机 
的 直接 发 明 者 。 候 选 人 包括 John Atanasoff、Clifford Berry, 
John Mauchly, J. Presper Eckert、KonradZuse 和 John von 
Neumann。 这 些 人 中 的 每 一 个 都 在 20 世 纪 30 年 代 末 和 40 
年 代 初 对 电子 计算 设备 的 研究 和 发 展 做 出 过 积极 的 追寻 。 

20 世 纪 50 年 代 到 60 年 代 ，Mauchly 和 Eckert 被 较为 
广泛 地 认可 为 电子 计算 机 之 父 ， 而 1945 年 建成 的 ENIAC 
( Electronic Numerical Integrator and Calculator， 电 子 数 字 积 分 计算 机 ) 被 认为 是 第 一 台电 
Fit HL, Mauchly 和 Eckert 在 ENIAC 上 成 功 的 工作 吸引 了 很 多 的 研究 经 费 ， 然 后 又 衍 
生出 商业 投资 。 当 美国 军 方 决定 采用 ENIAC 来 帮助 快速 准确 地 计算 弹道 表 的 时 候 ， 他 们 
的 工作 也 获得 了 很 高 的 知名 度 。 

1951 年 ，Sperry Rand 购买 了 ENIAC 的 专利 和 它 底 层 的 理念 。 然 后 ， 这 家 公司 要 求 
其 他 计算 机 制造 商 为 使 用 他 们 拥有 的 这 些 重要 概念 支付 版 税 一 一 特别 是 ， 现 代 计 算 机 中 都 
可 以 看 到 的 基础 体系 结构 ， 比 如 通过 带 辑 开关 做 算术 运算 的 电路 ， 防 止 电子 表示 的 信息 失 
效 的 内 存 刷新 电路 。Honeywell 公司 不 想 要 为 他 们 建造 和 出 售 的 每 台 计 算 机 都 支付 昂贵 的 
版 税 ， 所 以 他 们 让 他 们 的 律师 研究 了 现代 计算 机 的 历史 。 

Honeywell 的 律师 拿 出 了 证 据说 爱 荷 华 州 立 大 学 (Iowa State College) 的 John Atanasoff 
和 Clifford Berry 先 于 Mauchly 和 Eckert 几 年 提出 了 关键 性 的 技术 。ENIAC 到 1945 年 
才 可 以 实际 运行 ; 而 Atanasoff Æ 1939 年 就 有 了 可 工作 的 原型 系统 ， 在 .1942 年 就 有 了 
一 个 特殊 用 途 的 计算 机 。Atanasoff 的 机 器 包括 有 ENIAC 和 几乎 所 有 其 他 商业 上 成 功 的 
机 器 中 使 用 的 内 存 刷 新 电路 和 电子 加 法 器 /减法 器 电路 。 同 时 ，Honeywell 的 律师 还 发 现 
Mauchly 在 1941 年 6 月 访问 过 Atanasoff 几 和 天， 在 那 之 后 Atanasoff 的 一 些 思 想 出 现在 了 
Mauchly 的 项 目 中 。 所 有 这 些 信 息 都 有 力 地 表明 Atanasoff 的 工作 直接 影响 了 ENIAC 的 
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FA. MA, 1973 年 ， 法 庭 判 定 ENIAC 的 专利 无 效 ， 认 定 Atanaso 任 的 贡献 非常 重要 ， 
Mauchly 借鉴 了 这 些 思想 。Atanaso 任 如 果 想 要 保护 他 自己 ， 是 可 以 申请 专利 的 。 但 是 
Atanasoff fe Berry 并 没有 很 热切 地 市 场 化 他 们 的 研究 ， 而 当 第 二 次 世界 大 战 中 他 们 不 得 
不 服役 时 ， 他 们 的 项 目 陷入 停顿 。 

几乎 与 Atanasoff, Berry, Mauchly 和 Eckert 同时 ，Konrad Zuse 也 在 脑海 中 构思 了 一 
台 通用 计算 机 。 不 幸 的 是 ，Zuse 居住 并 效力 于 德国 ， 所 以 他 思想 的 种 子 没有 结 出 果实 。 
“我 们 预期 全 球 市 场 也 许可 以 容纳 5 台 计算 机 。” 
——Tom Watson 
IBM 主席 ，1949 年 






5.4.7 常量 和 .EQUATE 


.EQUATE 是 少数 几 个 不 生成 目标 代码 的 伪 操 作 之 一 。 此 外 ， 从 目标 代码 地 址 获取 符号 
值 的 标准 机 制 在 这 里 不 起 作用 。 .EQUATE 的 操作 说 明 如 下 : 

e 它 一 定 在 定义 符号 的 行 中 。 

e 它 使 得 符号 的 值 等 于 跟 在 .EQUATE 之 后 的 值 。 

© 它 不 生成 任何 目标 代码 。 

C++ 编译 器 用 . EQUATE 命令 翻译 C++ 常量 。 

除了 变量 是 全 局 的 而 不 是 局 部 的 之 外 ， 图 5-26 中 的 程序 和 图 2-6 中 的 程序 是 一 样 的 。 
它 展示 了 怎样 把 一 个 C++ 篆 量 翻译 为 机 器 语言 ， 同 时 也 说 明了 ASRA 汇编 语言 语句 的 使 用 。 
这 个 程序 计算 两 次 测验 的 平均 分 加 上 5 分 奖励 分 后 得 到 的 分 值 。 


高 级 语言 


#include <iostream> 
using namespace std; 


const int bonus = 5; 
int examl; 
int exam2; 
int score; 


int main () { 

cin >> examl >> exam2; 

score = (examl + exam2) / 2 + bonus; 

cout << “score = " << score << endl; 

return 0; 
} 
0000 040009 BR main 

bonus: .EQUATE 5 ;constant 

0003 0000 exami: BLOCK 2 ;global variable #2d 
0005 0000 exam2: .BLOCK 2 ;global variable #2d 
0007 0000 score: BLOCK 2 :global variable #2d 


0009 310003 main: DECI examl,d ;Cin >> examl 
000C 310005 DECI exam2,d ; >> exam2 





图 5-26 一 个 程序 ， 编 译 器 会 把 它 的 C++ 常量 翻译 成 机 器 语言 


225 
227 
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C10003 LDA examl,d ;score = (examl 
ADDA exam2,d ; + exam2) 
ASRA : 2 
ADDA bonus, i : + bonus 
STA score,d 
STRO msg,d scout << “score = ” 
DECO score,d ; << score 
CHARO NR” a A << end] 
STOP 
.ASCII “score = \x00” 


002F 


Symbol table: 

Symbol Value Symbol 
bonus 0005 examl 
exam2 0005 score 
main 0009 msg 


输入 
68 84 


输出 


score = 81 





图 5-26 ( 续 ) 
编译 硕 把 


const int bonus = 5; 
翻译 为 

bonus: .EQUATE 5 

图 5-26 中 的 汇编 语言 代码 有 两 点 值得 注意 。 首 先 ， 含 有 .EQUATE 的 行 在 机 器 语言 列 中 
是 没有 代码 的 。 由 于 没有 代码 ， 地 址 也 就 不 适用 了 ， 所 以 甚至 在 地 址 列 中 都 没有 地 址 。 这 
和 .EQUATE 不 生成 代码 的 规则 相 一 致 。 其 次 ， 图 5-26 包括 来 自 汇 编 右 列表 的 符号 表 。 从 表 
中 可 以 看 到 符号 bonus 的 值 为 5， 符 号 exam2 的 值 也 为 5, 但 是 原因 不 同 , exam2 的 值 为 $， 
因为 给 它 生 成 代码 的 .BLOCK 命令 在 地 址 0005 (hex) 处 。 但 bonus 没有 代码 ， 它 的 值 为 5， 
因为 它 被 .EQUATE 点 命令 设置 为 5。 

IO 和 赋值 语句 类 似 于 前 面 的 程序 。cin 按照 需求 翻译 为 DECI BK CHARI, cout 翻译 为 
DECO 或 CHARO0， 对 于 全 局 变量 都 采用 直接 寻 址 方式 。 一 般 来 说 ， 赋 值 语 句 翻 译 为 

© RARER. 

e 如 果 需 要 ， 对 表达 式 求 值 。 

© 存储 寄存 器 。 

为 了 计算 表达 式 


(examl + exam2) / 2 + bonus 


编译 器 生成 代码 把 exami 的 值 装 人 累加 器 ， 再 加 上 exam2 的 值 ， 然 后 用 ASRA 指令 把 
和 除 以 2。 LDA 和 ADDA 指令 使 用 直接 寻 址 ， 因 为 examl 和 exam? 是 全 局 变量 。 
但 编译 器 怎样 生成 加 bonus 的 代码 呢 ? 它 不 能 用 直接 寻 址 ， 因 为 没有 目标 代码 对 应 于 
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bonus ， 因 此 也 就 没有 地 址 。 取 而 代 之 的 是 语句 

ADDA bonus,i 
使 用 立即 数 寻 址 。 此 时 ， 操 作 数 指示 符 0005 (hex) = 5 (dec) 就 是 要 加 上 的 值 。 把 C++ 常量 
翻译 到 汇编 语言 的 一 般 规 则 是 : 

e 用 .EQUATE 声明 常量 。 

e 用 立即 数 寻 址 访问 常量 。 

在 更 为 实际 的 程序 中 ，score 的 类 型 会 是 float， 要 用 实数 除法 运算 来 计算 平均 分 。 
Pep/8 没有 硬件 支持 实数 ， 它 的 指令 集 也 不 包含 整数 乘法 和 除法 指令 。 这 些 运算 一 定 要 用 算 
术 移 位 和 循环 移 位 指令 编程 来 实现 。 


5.4.8 指令 和 数据 的 放置 


本 书 的 目的 是 展示 典型 计算 机 系统 中 抽象 层次 之 间 的 关联 。 所 以 ，Asmb5 层 翻 译 出 来 
的 整体 程序 结构 对 应 于 被 翻译 的 HOL6 程序 的 结构 。 具 体 来 说 ,在 Asmb5 程序 和 HOL6 程 
序 中 ， 全 局 变量 都 出 现在 主 程序 的 前 面 。 实 际 的 编译 器 并 没有 这 个 约束 ， 经 常会 改变 程序 和 
数据 的 位 置 。 图 5-27 是 对 图 5-26 中 C++ 程序 的 一 个 不 同 的 翻译 结果 ， 这 个 翻译 的 一 个 好 处 
是 没有 程序 开始 处 跳 转 到 主 程序 的 那个 分 支 语 句 。 


31001D main: examl,d ;Cin >> examl 
31001F exam2,d ; >> exam2 
C1001D examl,d ;Score = (examl 
71001F exam2,d : + exam2) 

LE 

700005 bonus,i 

£10021 score,d 

410023 msg,d scout << “score = " 
390021 score,d > << score 
50000A “NM ; << endl 

00 


bonus: .EQUATE 5 sconstant 


0000 += exami: -BLOCK 2 ;global variable #2d 
0000  exam2: .BLOCK 2 ;global variable #2d 
0000 score: .BLOCK 2 :global variable #2d 
73636F msg: -ASCII “score = \x00" 

726520 

302000 


Symbol table: 

Symbol Value Symbol 
main 0000 bonus 
examl 001D exam2 
score 0021 msg 


图 5-27 5-26 中 C++ 程序 的 另 一 种 翻译 ， 指 令 和 数据 的 放置 不 同 





总 结 


ws SA 


汇编 右 是 一 个 把 汇编 语言 程序 翻译 为 等 效 机 器 语言 程序 的 程序 。 冯 “' 诺 依 曼 设 计 原 理 
要 求 指 令 和 数据 都 存储 在 主 存 中 。 对 应 于 两 种 位 序列 ， 汇 编 语言 语句 有 两 种 类 型 。 对 于 程序 
语句 ， 汇 编 语言 用 助 记 符 代替 操作 码 和 寄存 器 -r 字段 ， 十 六 进 制 代替 二 进 制 操 作 数 指示 符 ， 
助 记 符 字 母 代替 寻 址 方式 。 对 于 数据 语句 ， 汇 编 语 言 使 用 伪 操 作 ， 也 叫 作 点 命令 。 
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使 用 直接 寻 址 方式 时 ， 操 作 数 指示 符 是 操作 数 的 主 存 地 址 ， 而 使 用 立即 数 寻 址 方式 时 ， 
操作 数 指示 符 就 是 操作 数 , 以 数学 方法 表示 为 Oprnd = OprndSpec。 立 即 数 寻 址 比 直 接 寻 址 
更 好 ， 因 为 立即 数 寻 址 的 操作 数 不 需要 和 指令 分 开 存储 。 因 为 在 指令 寄存 器 中 的 操作 数 对 
CPU 来 说 是 立即 可 用 的 ， 所 以 这 样 的 指令 执行 也 更 快 。 

汇编 语言 符号 消除 了 程序 中 需要 手工 确定 数据 和 指令 地 址 的 问题 。 符 号 的 值 是 一 个 地 
址 。 当 汇编 器 检测 到 一 个 符号 定义 时 ,会 把 该 符号 和 它 的 值 存储 到 符号 表 中 。 当 需要 使 用 某 
个 符号 时 ,汇编 器 会 用 符号 的 值 代替 符号 。 

高 级 语言 层 (HOL6 层 ) 的 变量 对 应 于 汇编 层 ( Asmb5 层 ) 的 内 存 地 址 。 在 HOL6 层 ， 
把 表达 式 赋值 给 变量 的 赋值 语句 会 在 Asmb5 层 翻译 为 一 个 装 入 (load)， 后 面 跟 一 个 表达 式 
求 值 ， 再 跟 一 个 存储 (store), HOL6 层 的 类 型 兼容 通过 编译 器 和 它 的 符号 表 来 实现 ， 这 个 
符号 表 要 比 汇编 器 的 符号 表 复 杂 很 多 。 在 Asmb5 层 ， 唯 一 的 类 型 是 位 ， 可 以 对 任何 位 模式 
做 任何 操作 。 


练习 
5.1 
*1. 把 下 列 机 器 语言 指令 转换 为 汇编 语言 ， 假 设 这 些 指令 不 是 由 伪 操 作 生 成 的 : 
(a) AAEF2A (b) 02 (c) D7003D 
2. 把 下 列 机 器 语言 指令 转换 为 汇编 语言 ， 假 设 这 些 指令 不 是 由 伪 操作 生成 的 : 
(a) 92B7DE (b) 03 (c) DF63DF 
*3. 把 下 列 汇编 语言 指令 转换 为 十 六 进 制 机 圳 语言 : 
(a) ASLA (b) CHARI 0x000F ,s (c) BRNE Ox01E6,i 
4. 把 下 列 汇编 语言 指令 转换 为 十 六 进 制 机 器 语言 : 
(a) ADDA OxO1FE, i (b) STRO 0x0000, sf (c) LDX OxO1FF,s 
*5. 把 下 列 汇编 语言 伪 操 作 转 换 为 十 六 进 制 机 絮语 言 : 
(a) .ASCII “Bear\x00" (b) .BYTE OxF8 (c) .WORD 790 
6. 把 下 列 汇编 语言 伪 操 作 转 换 为 十 六 进 制 机 需 语 言 : 
(a) .BYTE 13 (b) .ASCII "Frog\x00" (c) .WORD -6 
*7. 预测 下 面 汇编 语言 程序 的 输出 : 


CHARO 0x000C,d 
CHARO 0x000B,d 
CHARO 0x000A,d 
STOP 

-ASCII "gum" 

. END 


.预测 下 面 汇编 语言 程序 的 输出 : 


CHARO 0x0008,d 
CHARO 0x0007,d 
STOP 

ASCII “is” 

. END 


.如 果 输 入 为 g， 预 测 下 面 汇编 语言 程序 的 输出 。 如 果 输 入 为 A， TRON PT Se eee nt 解 
释 两 个 结果 不 同 的 原因 : 
CHARI 0x0010,d 
LDBYTEA 0x0010,d 
ANDA 0x0011,d 
STBYTEA 0x0010,d 
CHARO 0x0010,d 


oo 


O 
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STOP 

.BLOCK 1 
.WORD 0x00DF 
.END 


5.2 节 
*10. 如 果 点 命令 变 成 下 面 这 样 ， 预 测 图 5-13 程序 的 输出 : 


.WORD OxFFC7 ;First 
.BYTE Ox00 ;Second 


-BYTE "H" ;Third 
.WORD 873 ;Fourth 231 
11. 如 果 点 命令 变 成 下 面 这 样 ， 预 测 图 5-13 程序 的 输出 : 
.WORD OxFE63 ;First 
.BYTE 0x00 ;Second 
.BYTE "D° sthird 
.WORD 1401 ;Fourth 
12. 确定 下 列 汇编 语言 的 目标 代码 并 预测 输出 : 
* (a) (b) 
DECO ‘m',i DECO ‘Q',i 
CHARO '\n',i CHARO '\n',i 
DECO "mm", i DECO OxFFC3,1 
CHARO '\n',i CHARO '\n',i 
CHARO 0x0026,i CHARO 0x007D,i 
STOP STOP 
.END .END 
5.3 节 
*]3. 在 下 面 的 代码 中 ， 请 确定 符号 here Ñ there 的 值 。 写 出 十 六 进 制 目标 代码 (不 需 预 测 输出 )。 
BR there 
here: .WORD 9 
there: DECO here,d 
STOP 
.END 
14. 在 下 面 的 代码 中 ， 请 确定 符号 this、that 和 theother 的 值 。 写 出 十 六 进 制 目标 代码 (不 需 预 
测 输出 )。 
BR theOther 
this . WORD 17 
that WORD 19 
theOther : DECO this,d 
DECO that,d 
STOP 
. END 
*IS 在 下 面 的 代码 中 ， 请 确定 符号 this 的 值 。 预 测 并 解释 汇编 语言 程序 的 输出 : 
this: CHARO this,d 
STOP 
. END Zaz 


16. 在 下 面 的 代码 中 ， 请 确定 符号 this 的 值 。 预 测 并 解释 汇编 语言 程序 的 输出 : 


this: DECO this,d 
STOP 
. END 
54% 


17. YS as 0 Soe FF i AFF S RA BESS LH? 有 哪些 不 同 的 地 方 ? 
18. C++ Sei PE ai 2 1B FER ER BIR 2 
19. 假定 你 有 一 台 Pep/8 型 计算 机 和 下 面 的 磁盘 文件 : 
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A 文件: 用 机 器 语言 写 的 Pep/8 汇编 语言 汇编 器 

B 文件 : 用 汇编 语言 写 的 C++ 到 汇编 语言 的 编译 器 

C 文件 ， 从 一 个 数据 文件 读 和 人 数字 并 输出 中 位 数 的 C++ 程序 

D 文件 : C 文件 中 求 中 位 数 程序 的 数据 文件 处 理 
NETAN, = 5-28 yn 次 ， 每 “第 1 次 运行 CE 


rp me dine aerate 
后 面 运行 的 输入 文件 ， 或 者 作为 要 运行 的 程序 。 描 述 文件 “第 3 次 运行 —— 


E、F、G 和 H 的 内 容 ， 用 适当 的 文件 字母 标注 图 5-28 中 第 4 次 运行 | 


的 空 框 。 men 
图 5-28 练习 19 中 的 计算 机 运行 
问题 
5.41 
20. 写 一 个 在 屏幕 上 输出 你 名 字 的 汇编 语言 程序 。 要 求 使 用 .ASCII 伪 操 作 在 程序 的 底部 存储 字符 。 使 
用 CHARO 指令 输出 字符 。 
5.2 节 
21. 写 一 个 在 屏幕 上 输出 你 名 字 的 汇编 语言 程序 。 要 求 对 于 你 名 字 中 的 每 个 字母 ，CHARO0 的 操作 数 都 
使 用 字符 常量 立即 数 寻 址 。 
22. 写 一 个 在 屏幕 上 输出 你 名 字 的 汇编 语言 程序 。 要 求 对 于 你 名 字 中 的 每 个 字母 ，CHAR0 的 操作 数 都 
使 用 十 进 制 常量 立即 数 寻 址 。 
23. 写 一 个 在 屏幕 上 输出 你 名 字 的 汇编 语言 程序 。 要 求 对 于 你 名 字 中 的 每 个 字母 ，CHAR0 的 操作 数 都 
使 用 十 六 进 制 常量 立即 数 寻 址 。 
5.4 节 
24. 写 出 对 应 于 下 面 C++ 程序 的 汇编 语言 程序 : 


#include <iostream> 
using namespace std; 


a 
> 


int numl; 

int num2; 

main () { 
cin >> numl >> num2; 
cout << num2 << end] << numl << endl; 
return 0; 


} 
25. 写 出 对 应 于 下 面 C++ 程序 的 汇编 语言 程序 : 


#include <iostream> 
using namespace std; 


const char chConst = ‘a'; 
char chl; 
char ch2; 


int main () { 
cin >> chl >> ch2; 
cout << chl << chConst << ch2; 
return 0; 

} 


26. 写 出 对 应 于 下 面 C++ 程序 的 汇编 语言 程序 : 
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aK 
Dil. 


include <iostream> 
using namespace std; 


const int amount = 20000; 
int num; 
int sum; 


int main () { 
cin >> num; 
sum = num + amount; 
cout << “sum = " << sum << endl; 
return 0; 


} 234 
测试 程序 两 次 。 第 一 次 ， 给 num 输入 一 个 值 使 得 sum 在 Pep/8 计算 机 人 允许 的 范围 内 。 第 二 次 ， 输 
A num 的 值 ， 在 范围 内 ， 但 是 使 sum 超出 范围 。 注 意 超 出 范围 的 条 件 不 会 导致 出 错 信 息 ， 只 是 会 
给 出 一 个 不 准确 的 值 。 解 释 这 个 值 。 
27. 写 出 对 应 于 下 面 C++ 程序 的 汇编 语言 程序 : 


#include <iostream> 
using namespace std; 


int width; 
int length; 
int perim; 


int main () { 
cin >> width >> length; 
perim = (width + length) * 2; 
cout << "w=" << width << endl; 
cout << "1 =" << length << endl; 
cout << endl; 
cout << "p = " << perim << endl; 
return 0; 

} 


28. 写 出 对 应 于 下 面 C++ 程序 的 汇编 语言 程序 : 


#include <iostream> 
using namespace std; 


char ch; 


int main () { 
Cin 2> chi 
ch--; 
cout << ch << endl; 
return 0; 
} 


29. 写 出 对 应 于 下 面 C++ 程序 的 汇编 语言 程序 : 


#include <iostream> 
using namespace std; 


int numl; 
int num2; 


int main () { 
cin >> numl; 
num2 = -numl; 
cout << "numl = " << numl << endl; 
cout << "num2 = " << num2 << endl; 
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return 0; 
235 } 


30. 写 出 对 应 于 下 面 C++ 程序 的 汇编 语言 程序 : 


#include <iostream> 
using namespace std; 


int num; 


int main () { 
cin >> num; 
num = num / 16; 
cout << “num = " << num << endl; 
return 0; 


} 
31. 写 出 对 应 于 下 面 C++ 程序 的 汇编 语言 程序 : 


#include <iostream> 
using namespace std; 


int num; 


int main () { 
cin >> num; 
num = num % 16; 
cout << “num = " << num << endl; 
return 0; 
236 } 


| 第 6 章 
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本 书 的 主题 是 抽象 层次 的 概念 在 计算 机 科学 中 的 应 用 。 本 章 继 续 这 一 主题 ， 向 你 展示 高 
级 语言 层 和 汇编 层 之 间 的 抽象 层次 关系 。 本 章 审视 HOL6 层 的 C++ 语言 特性 ， 展 示 编 译 器 
怎样 把 具有 这 些 属性 的 程序 翻译 为 等 效 的 Asmb5 层 程序 。 

HOL6 层 语言 和 Asmb5 层 语 言 的 一 个 主要 区 别 在 于 Asmb5 层 没 有 大 量 的 数据 类 型 。 在 
C++ 中 ， 几 乎 可 以 任意 组 合 定义 整数 、 实 数 、 数 组 、 布 尔 和 结构 ,但 汇编 语言 只 有 位 和 字 
节 。 如 果 要 用 汇编 语言 定义 一 个 结构 数组 ， 就 必须 相应 地 区 分 位 和 字 节 。 如 果 在 HOL6 层 编 
程 ， 编 译 器 会 自动 完成 这 个 工作 。 

两 者 之 间 的 另 一 个 不 同 与 控制 流 有 关 。C++ if, while, do, for, switch 和 函数 
语句 来 改变 正常 顺序 的 控制 流 ， 但 汇编 语言 受 冯 ， 诺 依 曼 基 本 设计 所 限 ， 只 能 使 用 很 原始 的 
控制 语句 。 本 章 将 展示 编译 器 必须 怎样 把 几 个 原始 的 Asmb5 层 控制 语句 联合 在 一 起 来 执行 
一 条 更 强大 的 HOL6 层 控制 语句 。 


6.1 栈 寻 址 和 局 部 变量 


当 程 序 调用 函数 时 ， 程 序 为 返回 值 、 参 数 和 返回 地 址 在 运行 时 栈 上 分 配 存储 空间 ， 然 后 
基数 给 它 的 局 部 变量 分 配 存储 空间 。 栈 相对 寻 址 允许 函数 访问 被 压 人 栈 中 的 信息 。 

可 以 把 一 个 C++ 程序 的 main() 看 作 操作 系统 调用 的 函数 。 你 可 能 比较 熟悉 主 程序 有 
argc 和 argv 两 个 参数 ， 像 下 面 这 样 : 

int main (int argc, char* argv[]) 
用 这 样 的 方式 声明 main() 函数 ，argv 和 arge 与 返回 地 址 和 局 部 变量 一 起 被 压 人 运行 时 栈 。 

为 了 使 事情 更 简单 ， 本 书 总 是 把 main() 声明 为 不 带 参 数 ， 并 忽略 给 整数 返回 值 和 返回 
地 址 分 配 存储 空间 这 一 事实 。 因 此 ， 在 运行 时 栈 上 给 main() 分 配 的 唯一 存储 空间 就 是 给 局 
部 变量 的 。 图 2-8 展示 了 运行 时 栈 上 有 返回 值 和 返回 地 址 的 内 存 模型 。 图 2-41 展示 了 这 种 
简化 的 内 存 模 型 。 


6.1.1 栈 相对 寻 址 


使 用 栈 相 对 寻 址 ， 操 作 数 和 操作 数 指示 符 之 间 的 关系 是 

Oprnd = Mem[SP + OprndSpec] 

栈 指针 作为 一 个 内 存 地 址 ， 操 作 数 指示 符 会 加 上 这 个 地 址 。 图 4-39 展示 了 用 户 栈 在 主 
存 中 从 地 址 FBCF 开始 加 上 增加 。 当 一 个 条 目 被 压 人 运行 时 栈 时 ， 它 的 地 址 小 于 栈 顶 条 目的 
地 址 。 

可 以 把 操作 数 指示 符 想 象 成 距离 栈 项 的 俩 移 量 。 如 果 操 作 数 指示 符 是 0， 那么 指令 访问 栈 
TRAE Mem[SP]; 如 果 操 作 数 指示 符 是 2， 那 么 就 访问 栈 顶 下 面 2 字 节 的 值 Mem[SP + 2]. 

Pep/8 指令 集 有 两 条 直接 用 于 操控 栈 指针 的 指令 ，ADDSP HI SUBSP (CALL、RETn 和 
RETTR 间接 操控 栈 指针 )。ADDSP 简单 地 把 栈 指 针 值 增加 一 个 值 ，SUBSP 将 栈 指针 值 减 去 一 
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个 值 。ADDSP 的 RTL 描述 是 

SP 二 SP+Oprnd; NSP<0, Z- SP=0,V< {WH}, Ce {H} 
SUBSP 的 RTL 描述 是 

SP + SP - Oprnd; N< SP<0, Ze SP=0,V< {#W}, Ce {H} 

尽管 可 以 对 指针 值 进行 加 / 减 ， 但 是 不 能 用 装 和 人 指令 设置 栈 指针 的 值 。 没 有 LDSP 指令 。 
那么 究竟 怎样 设置 栈 指 针 呢 ? 当 在 Pep/8 模拟 器 上 选择 执行 选项 时 ， 会 发 生 下 列 两 个 动作 : 

SP — Mem[FFF8] 

PC < 0000 

第 一 个 动作 把 栈 指针 设置 为 存储 单元 FFF8 的 内 容 。 这 个 位 置 位 于 操作 系统 的 ROM, 
它 包含 应 用 程序 运行 时 栈 顶 部 的 地 址 。 因 此 当选 择 执行 选项 时 ， 能 正确 地 初始 化 栈 指 针 。 
Pep/8 操作 系统 会 把 SP 默认 初始 化 为 FBCF ， 应 用 程序 绝 不 会 把 它 设置 为 任何 其 他 的 值 。 通 
常情 况 下 ， 应 用 程序 只 需要 在 把 条 目 压 入 运行 时 栈 时 增加 栈 指针 ， 在 把 条 目 弹 出 运行 时 栈 时 
减 小 栈 指针 。 


6.1.2 访问 运行 时 栈 
图 6-1 展示 了 怎样 把 数据 压 人 栈 ， 用 栈 相 对 寻 址 访问 数据 ， 以 及 从 栈 中 弹出 数据 。 程 序 


把 字符 串 BMW 压 人 栈 ， 接 着 压 人 十 进 制 整数 335 和 字符 “1 7 ， 然 后 输出 这 些 条 目 ， 并 把 它 
们 弹出 栈 。 


C00042 LDA 
FOFFFP STBYTEA. + 
C0004D LDA 
FSFRFE STBYTEA + 


B ;push B 
1 
M 
2 
C00057 LDA 'W', ;push W 
3 
3 
5 
i 
6 


;push M 


F3FFFD STBYTEA -3,5 
C0014F LDA 335; ;push 335 
E3FFFB STA = 
C00069 LDA i 
F3FFFA STBYTEA = 
680006 SUBSP ;6 bytes on the run-time stack 

CHARO : ;output B 

CHARO i output M 

CHARO A ;Output W 

DECO i output 335 

CHARO ; ;Output i 

ADDSP , ;deallocate stack storage 

STOP 

. END 


3 
> ;push i 


BMW335i 





图 6-1 栈 相对 寻 址 


图 6-2a 给 出 了 程序 执行 前 栈 指针 CSP) 和 主 存 的 值 。 机 器 根据 Mem[FFF8] 的 向 量 把 栈 
指针 初始 化 为 FBCF。 
前 两 条 指令 
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a) 程序 执行 之 前 b) SUBSP 执 行 之 后 
图 6-2 把 BMW335i 压 人 图 6-1 所 示 的 运行 时 栈 中 
LDA 'B',i 
SIBYTEA «1,5 


把 ASCI 字符 “ B” 放 人 入 栈 顶 的 字 节 ，LDA 把 “B” 字 节 放 人 累加 器 的 右 半 部 分 ，STBYTEA 把 它 
放 和 人 栈 顶 ， 存 储 指 令 采 用 栈 相 对 寻 址 ， 操 作 数 指示 符 为 -1 (dec) = FFFF (hex)。 因 为 栈 指 
针 的 值 是 FBCF， 所 以 “ B ”存储 在 Mem[FBCF + FFFF] = Mem[FBCE]。 接 下 来 的 两 条 指 
令 分 别 把 “M” 和 “W ” 放 在 Mem[FBCD] 和 Mem[FBCC]。 

然而 ， 十进制 整数 335 占用 2 字 节 。 程 序 必须 把 它 存储 在 距离 “ W ”地 址 2 字 节 的 地 
方 ， 这 就 是 为 何 存储 335 的 指令 是 

STA -5,S 
而 不 是 

STA -4.5 
的 原因 。 

通常 情况 下 ， 当 把 一 个 条 目 压 入 运行 时 栈 时 ， 必 须要 考虑 每 个 条 目 占 用 的 字 节 数 ， 以 及 
相应 地 设置 好 操作 数 指示 符 。 

SUBSP 指令 把 栈 指针 减 6， 如 图 6-2b 所 示 ， 这 就 完成 了 和 人 栈 操作 。 

跟踪 一 个 使 用 栈 相 对 寻 址 的 程序 不 需要 知道 栈 指针 的 绝对 值 。 如 果 栈 指针 被 初始 化 为 其 
他 值 ， 比 如 FA18， 和 信 栈 操作 也 会 做 同样 的 工作 。 这 种 情况 下 ,“B'、“M”、“W’”、335 和 
“i” 会 分 别 在 Mem[FA17]、Mem[FA16]、Mem[FA15]、Mem[FA13] 和 Mem[FA12]， 栈 指针 
最 后 会 变 成 FA12。 尽 管 绝对 内 存 地 址 不 同 ， 但 
是 这 些 值 相对 于 栈 顶 的 位 置 都 是 相同 的 。 

图 6-3 是 一 个 跟 踩 运行 更 便捷 的 方法 ， 它 利 
用 了 栈 指 针 中 的 值 是 无 关 的 这 个 事实 。 不 是 显示 
栈 指针 的 值 ， 而 是 给 出 指向 存储 单元 的 箭头 ， 栈 
指针 中 存放 着 这 个 存储 单元 的 地 址 。 不 显示 内 存 
单元 的 地 址 ， 而 是 给 出 距离 栈 顶 的 偏 移 量 。 从 现 


SP * 一 > 0 


Nn nA A 一 





字 执 行 之 前 b 执行 之 后 
在 开始 ， 都 会 采用 这 种 惯例 来 画 运行 时 酚 的 状 MINT pedi 
态 图 图 6-3 ”标明 相对 地 址 的 图 6-2 的 栈 
指令 
CHARO 5,5 


从 栈 输出 ASCI 字符 “B " 。 注 意 , 在 SUBSP 执行 前 ,“B ”的 栈 相对 地 址 是 -1， 但 是 执行 
后 变 成 了 5。 因 为 栈 指针 变 了 ， 所 以 它 的 栈 相对 地 址 不 同 了 。 
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SIBYTEA. “LS 
和 
CHARO 5,5 
两 者 访问 相同 的 内 存单 元 。 如 图 6-3b 所 示 ， 同 样 也 都 用 栈 偏 移 量 输出 其 他 条 目 。 
指令 
ADDSP 6,71 


通过 对 SP 加 6 在 运行 时 栈 上 释放 了 6 字 节 的 存储 空间 。 因 为 栈 朝 着 更 小 地 址 的 方向 向 上 生 
长 ， 所 以 通过 减 小 栈 指针 值 分 配 存储 空间 ， 通 过 增加 栈 指针 值 释放 存储 空间 。 


6.1.3 ”局 部 变量 


前 一 章 我 们 讲 了 编译 占 怎 样 翻译 程序 的 全 局 变量 。 用 .BLOCK 点 命令 给 全 局 变量 分 配 存 
储 空间 ， 用 直接 寻 址 方式 进行 存 取 。 然 而 ， 局 部 变量 是 在 运行 时 栈 上 分 配 的 ， 要 翻译 程序 的 
局 部 变量 ， 编 译 器 要 : 

e 用 SUBSP 分 配 局 部 变量 。 

e 用 栈 相 对 寻 址 访问 局 部 变量 。 

e 用 ADDSP 释放 存储 。 

全 局 变量 和 局 部 变量 之 间 的 一 个 重要 不 同 点 是 分 配 发 生 的 时 间 。. BLOCK 点 命令 不 是 可 
执行 语句 ， 在 程序 执行 前 就 给 全 局 变量 的 存储 保留 了 固定 的 位 置 。 相 反 ，SUBSP 是 可 执行 语 
句 ， 在 程序 执行 期 间 ， 在 运行 时 栈 上 创建 局 部 变量 的 存储 空间 。 

图 6-4 中 的 C++ 程序 来 目 图 2-6， 除 了 变量 被 声明 为 maino 的 局 部 变量 外 ， 和 图 5-26 中 
的 程序 是 一 样 的 。 尽 管 程序 的 用 户 感受 不 到 这 个 区 别 ， 但 是 编译 器 执行 的 翻译 却 非常 不 同 。 
图 6-5 给 出 了 这 个 程序 的 运行 时 栈 。 和 图 5-26 中 一 样 ，bonus 是 一 个 常量 ， 用 .EQUATE 
来 定义 。 不 过 ， 局 部 变量 也 用 EQUATE 定义 。 对 于 常量 ，.EQUATE 指定 常量 的 值 ， 但 对 
于 局 部 变量 ，.EQUATE 指定 在 运行 时 栈 上 的 栈 偏 移 量 。 例 如 ， 图 6-5 显示 局 部 变量 exam] 
的 栈 偶 移 量 是 4， 因 此 汇编 语言 程序 使 得 符号 examl 等 于 4。 在 汇编 语言 代码 中 可 以 看 
到 ，.EQUATE 不 会 为 局 部 变量 生成 任何 代码 。 


高 级 语言 


#include <iostream> 
using namespace std; 


int main () { 
const int bonus = 5; 
int examl; 
int exam2; 
int score; 
cin >> examl >> exam2; 
score = (examl + exam2) / 2 + bonus; 
cout << "score = " << score << endl; 
return 0; 
} 
汇编 语言 
0000 040003 BR main 
bonus: .EQUATE 5 ;constant 


图 6-4 一 个 具有 局 部 变量 的 程序 。 这 个 C++ 程序 来 自 图 2-6 
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examl: .EQUATE 4 :local variable #2d 
exam2: .EQUATE 2 :local variable #2d 
score: „EQUATE 0 :local variable #2d 


680006 main: SUBSP 6,7 sallocate #examl #exam2 #score 
330004 DECI examl, ;Cin >> examl 
330002 DECI exam2, ; >> exam2 
LDA examl, ;score = (examl 
ADDA exam2, : + exam2) 
ASRA : f 2 
ADDA bonus, ; + bonus 
E30000 STA score, 
410026 STRO msg,d scout << “score = " 
3B0000 DECO score, : << score 
50000A CHARO “Ka, : << endl 
600006 ADDSP 6,i ;deallocate #score #exam2 #examl 
00 STOP 
73636F ~ -ASCII “score = \x00" 
726520 
3D2000 





图 6-4 ( 续 ) 


main() 中 可 执行 语句 的 翻译 有 两 方面 与 全 局 变量 不 同 。 首 先 ，SUBSP 和 ADDSP 在 运 
行 时 栈 上 给 局 部 变量 分 配 和 释放 存储 。 其 次 ， 对 变量 的 访问 都 使 用 栈 相 对 寻 址 而 不 是 直接 寻 
址 。 除 此 之 外 ， 赋 值 和 输出 语句 的 翻译 是 一 


样 的 —6 score SP e—> 0 score 
i 4 exam2 2 exam2 

图 6-4 展示 怎样 写 局 部 变量 的 调试 跟踪 ss -2 examl 4 examl 
标签 。 汇 编 语 言 程序 用 EQUATE 伪 操 作 使 “““ rs piso “ie 
用 格式 跟踪 标签 #2d， 告 诉 调试 器 exam], a) SUBSPI I bia 行 后 
exam2 和 score 应 该 显示 为 2 字 节 的 十 进 制 值 。 图 6-5 图 6-4 中 程序 的 运行 时 栈 


用 SUBSP 指令 为 这 些 局 部 变量 在 运行 时 栈 上 分 配 存 储 空 间 ， 因 此 ， 为 了 调试 程序 ， 就 
要 在 SUBSP 的 注释 中 指定 3 个 符号 跟踪 标签 #examl 、#exam2 和 #score。 当 单 步 跟踪 程 
序 时 ，Pep/8 系统 会 在 屏幕 上 显示 一 个 图 标 ， 就 像 图 6-5b 运行 时 栈 右边 的 单元 符号 标签 。 为 
了 调试 器 能 够 准确 工作 ， 注 释 字 段 中 列 出 的 符号 跟踪 标签 的 顺序 必须 与 它们 压 人 运行 时 栈 的 
顺序 一 致 。 在 这 个 程序 中 ，examl 首先 压 人 运行 时 栈 ， 然 后 是 exam2 和 score。 此 外 ， 这 
个 顺序 必须 和 .EQUATE 伪 操 作 中 的 偏 移 量 一 致 。 

用 ADDSP 指令 来 释放 变量 。 同 样 ， 列 出 变量 的 顺序 必须 与 弹出 运行 时 栈 的 顺序 相对 应 。 
因为 变量 弹出 的 顺序 与 压 入 的 顺序 相反 ， 所 以 必须 以 与 SUBSP 指令 相反 的 顺序 列 出 来 。 在 
这 个 程序 中 ，score 首先 弹出 ， 接 着 是 exam2 和 examl。 

尽管 程序 的 执行 不 需要 跟踪 标签 ， 但 是 它们 可 以 用 于 记录 程序 。 符 号 跟踪 标签 提供 的 信 
息 对 程序 的 阅读 者 来 说 是 非常 有 价值 的 ， 因 为 它 描述 了 SUBSP 和 ADDSP 指令 的 目的 。 本 章 
的 汇编 语言 程序 都 包括 为 了 记录 之 用 的 跟踪 标签 ， 你 写 程序 也 应 该 这 样 写 。 


6.2 转移 指令 和 控制 流 


Pep/8 指令 集 有 8 个 条 件 分 支 语句 : 
e BRLE 小 于 等 于 分 支 
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BRLT 
BREQ 
BRNE 
BRGE 
BRGT 
BRV 

BRC 


WTI 
等 于 分 支 
不 等 于 分 支 
大 于 等 于 人 外文 
大 于 分 支 

V 分 支 
CX 


每 个 条 件 分 文 检测 4 个 状态 位 N、Z、V 和 C 中 的 一 个 或 者 两 个 。 如 果 条 件 为 真 ， 那 么 操作 
数 放 入 PC， 发 生 转 移 ; 如 果 条 件 为 假 ， 操 作 数 不 放 和 人 PC， 条 件 分 支 后 面 的 指令 正常 执行 。 
可 以 把 这 想象 成 一 个 16 位 的 结果 和 0000 (hex) 做 比较 。 例 如 ，BRLT 检测 结果 是 否 小 于 0, 
如 果 N 为 1， 则 小 于 0; BRLE 检测 结果 是 否 小 于 等 于 0， 如 果 N 为 1 或 者 Z 为 1， 则 小 于 等 
于 0。 每 个 条 件 分 支 指令 的 RTL 描述 如 下 : 


BRLE N=1 V Z=1=>PC< Oprnd 
BRLT N = 1 => PC < Oprnd 

BREQ Z = 1 => PC < Oprnd 

BRNE Z = 0 => PC + Oprnd 

BRGE N = 0 => PC © Oprnd 

BRGT N = 0 V Z= 0 => PC < Oprnd 
BRV V = 1 => PC < Oprnd 

BRC C = 1 => PC © Oprnd 

转移 是 否 发 生 取 决 于 状态 位 的 值 ， 其 他 指令 的 执行 也 会 影响 状态 位 。 例 如 ， 
LDA num,s 

BRLT place 


把 num 的 内 容 装 入 累加 器 。 如 果 装 和 人 的 这 个 字 是 负数 ， 即 它 的 符号 位 为 1， 那 么 NN 位 被 置 为 
1, BRLT 检测 N 位 并 转移 到 位 于 place 的 指令 。 男 一 方面 ， 如 果 装 入 累加 器 的 不 是 负数 ， 那 
2444 么 NN 位 为 0， 当 BRLT 检测 N 位 时 ， 不 会 发 生 转 移 ， 接 下 来 会 执行 BRLT 后 面 的 指令 。 
翻译 if 语句 
图 6-6 展示 了 编译 器 怎样 把 if 语句 从 C++ 翻译 成 汇编 语言 。 这 个 程序 计算 一 个 整数 的 
绝对 值 。 


6.2.1 


#include <iostream> 
using namespace std; 


int main () { 
int number; 
cin >> number; 
if (number < 0) { 

number = -number; 

} 
cout << number; 
return 0; 





图 6-6 HOL6 层 和 Asmb5 层 的 if 语句 
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} 


汇编 语言 


-— 


0000 040003 BR main 
number: .EQUATE 0 :local variable #2d 


680002 main: SUBSP Zi :allocate #number 
330000 DECI number, :Cin >> number 
C30000 if: LDA number, ;if (number < 0) 
0E0016 BRGE endIf 
C30000 LDA number, : number = -number 
1A NEGA 
E30000 STA number, 
3B0000 DECO number,s scout << number 
600002 ADDSP 2,i :deallocate #number 
00 STOP 

.END 





图 6-6 ( 续 ) 


汇编 语言 注释 显示 对 应 的 高 级 语言 程序 。cin 语句 翻译 为 DECI，cout 语句 翻译 为 
DEC0， 赋 值 语 句 翻译 为 LDA、NEGA、STA 序列 。 
编译 器 把 if 语句 转换 为 LDA、BRGE 序列 。 当 执行 LDA 时 ， 如 果 装 人 累加 器 的 值 是 正 


数 或 零 ， 那 么 N 位 为 0。 这 个 条 件 会 跳 过 if 语句 主 S] Sl 

体 。 图 6-7a 展示 了 HOL6 层 的 if 语句 结构 ，S1 代 b ni Ci 

表 语 句 cin>>number, Cl 代表 条 件 number<0， } > | 
S3 


S2 代表 语句 number=—-number, M S3 代表 语句 
cout<<number。 图 6-7b 展示 了 使 用 Asmb5 层 更 
加 原始 的 分 支 指令 的 结构 。C1 下 面 的 点 代表 条 件 图 97 Asmb5 层 的 1f Hots 
转移 BRGE。 

限定 复合 语句 的 花 括号 {1} 在 汇编 语言 中 没有 对 应 的 内 容 。 下 面 的 序列 

语句 1 

if (number) >= 0{ 


语句 2 
语句 3 


a) HOL6 层 的 结构 b) 图 6-6 在 Asmb5 层 的 结构 


} 
语句 4 
EN 

语句 1 

tf: LDA number, d 
BRLT endif 
语句 2 
语句 3 

endif: 语句 4 


6.2.2 it dit an 


你 可 能 已 经 注意 到 图 6-6 有 一 个 不 是 特别 必要 的 装 人 语句 。 可 以 删除 OOOF 处 的 LDA, 
因为 前 面 在 0009 处 装 入 的 number 的 值 仍 然 在 累加 器 中 。 
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问题 是 编译 器 该 怎么 做 呢 ? BERRAAT ae SPE AE — A m BS i AT a] TY EF o 


假想 需要 设计 一 个 把 C++ 翻译 到 汇编 语言 的 编译 器 。 当 编译 顺 检 测 到 赋值 语句 时 ， 编 程 产 


生 下 面 的 序列 : (a) RA RIM; (b) 如 果 需 要 ， 对 表达 式 求 值 ; (c) 把 结果 存储 到 变量 。 这 
样 编译 龙 就 会 生成 图 6-6 那样 的 代码 ， 在 000F 有 LDA 语句 。 

可 以 想象 如 果 要 删除 不 必要 的 装 和 语句， 对 于 编译 需 程 序 来 说 有 多 大 的 难度 。 当 编译 器 
检测 到 赋值 语句 时 ， 它 并 不 总 是 生成 初始 的 装 和 语句， 而 是 分 析 前 面 生成 的 语句 ， 记 住 累加 需 
的 内 容 。 如 果 它 发 现 累加 和 需 的 值 和 初始 装 入 语句 要 放 在 那里 的 值 一 样 ， 它 就 不 生成 初始 装 和 人 语 
句 。 在 图 6-6 中 ， 编 译 需 需要 记 住 ， 根 据 if 语句 生成 的 代码 ，number 的 值 仍 然 在 累加 器 中 。 

一 个 尽力 使 目标 程序 更 短 更 快 的 编译 器 叫 作 优化 编译 器 。 可 以 想象 设计 优化 编译 器 比 设 
计 非 优化 编译 髓 难 很 多 。 不 仅 优化 编译 器 更 难 编写 ， 而 且 也 需要 更 长 时 间 编 译 ， 这 是 因为 这 
种 编译 器 必须 更 仔细 地 分 析 源 程序 。 

优化 编译 右 和 非 优 化 编译 器 哪个 更 好 呢 ? 这 取决 于 使 用 编译 需 来 干什么 。 如 果 是 开发 软 
件 ， 为 了 测试 和 调试 一 个 过 程 需要 大 量 的 编译 ， 那 么 就 需要 一 个 翻译 很 快 的 编译 器 ， 也 就 是 
非 优化 编译 器 。 如 果 是 一 个 大 型 固定 的 程序 ， 这 个 程序 会 被 许多 用 户 重复 执行 很 多 遍 ， 那 么 
需要 目标 程序 更 快 地 执行 ， 因 此 这 时 需要 优化 编译 器 。 通 常 ， 正 在 开发 和 调试 的 软件 使 用 非 
优化 编译 副 ， 最 后 一 次 用 优化 编译 紫 翻 译 给 用 户 。 

实际 的 编译 项 介 于 这 两 种 极端 情况 之 间 。 本 章 中 的 例子 偶尔 会 呈现 部 分 优化 的 目标 代 
码 ， 大 多 数 赋值 语句 以 非 优化 的 形式 呈现 ， 例 如 图 6-6 中 的 赋值 语句 。 


6.2.3 翻译 if/else 语句 


图 6-8 说 明了 if/else 语句 的 翻译 。 这 个 C++ 程序 和 图 2-10 的 程序 一 样 。if 语句 体 
需要 一 个 额外 的 无 条 件 分 支 语 句 绕 过 else 语句 体 。 如 果 编 译 器 省 略 0015 的 BR， 输 入 就 会 
是 127， 而 输出 将 会 是 high1ow。 


高 级 语言 
#include <iostream> 
using namespace std; 


int main () { 
const int limit = 100; 
int num; 
cin >> num; 
if (num >= limit) { 
cout << “high”: 
} 
else { 
cout << "low"; 
} 
return 0; 
} 


汇编 语言 
0000 040003 BR main 


limit: .EQUATE 100 :constant 
num: .EQUATE 0 ;local variable #2d 





图 6-8 HOL6 和 Asmb5 层 的 if/else 语句 。 这 个 C++ 程序 来 自 图 2-10 
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680002 SUBSP 2,i :allocate #num 
330000 DECI num, s ;cin >> num 
C30000 LDA num,s ;if (num >= limit) 
B00064 CPA limit,i 
080018 BRLT else 
41001F STRO msgl,d : cout << "high" 
040018 BR endif ;else 
410024 else: STRO msg2,d s cout << "low" 
600002 endIf: ADDSP 2,73 ;deallocate #num 
00 STOP 
686967 msgl: .ASCII “high\x00" 
6800 
6C6F77 msg2: .ASCII “low\x00" 
00 

. END 





图 6-8 ( 续 ) 


和 图 6-6 不 一 样 的 是 图 6-8 的 if 语句 不 会 将 变量 的 值 和 和 零 比 较 ， 它 用 CPA 把 变量 值 
和 另 一 个 非 零 值 进行 比较 ，CPA 表示 比较 累加 器 。CPA 对 累加 器 减 去 操作 数 并 相应 地 设置 
NZVC 位 。 除 了 SUBr 把 结果 存储 在 寄存 器 r (累加 器 或 变 址 寄存 器 )， 而 CPr 忽略 减法 的 结 
REA, CPr Al SUBr 是 一 样 的 。CPr AY RTL 描述 是 

T <r-Opmd; N<T<0,Z<T=0,V< {#H},C<— {进位} 


XAT ZANT {A 
这 个 程序 计算 num-limit 并 设置 NZVC 位 。BRLT 测 试 N 位 ， 如 果 
num - limit < 0 S1 
即 如 果 Kai Ci 
num < limit a 92 
就 设置 N。 这 是 执行 el se 部 分 的 条 件 。 me h 
图 6-9 展示 了 这 两 层 上 的 控制 语句 结构 。 54 S4 
图 6-9a 是 HOL6 层 的 控制 语句 ， 图 6-9b 是 这 个 2) HOLEN bY GREAS 
程序 到 Asmb5 层 的 翻译 。 图 6-9 Asmb5 层 的 if/else 语句 结构 


6.2.4 翻译 while 循环 


循环 需要 转移 到 前 面 的 指令 。 图 6-10 展示 了 while 语句 的 翻译 。 这 个 C++ 程序 和 
图 2-13 的 程序 一 样 ， 它 把 输入 的 ASCI 字符 重复 传送 到 输出 ， 使 用 * 作为 标记 符号 ， 如 果 
输入 是 happy*， 则 输出 happy. 


高 级 语言 
#include <iostream> 
using namespace std; 


char letter; 


int main () { 
cin >> letter; 
while (letter != '*') { 


图 6-10 HOL6 和 Asmb5 层 的 while 语句。 这 个 C++ 程序 来 自 图 2-13 
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cout << letter; 
cin >> letter; 


} 
return 0; 
} 
汇编 语言 
0000 040004 BR 
0003 00 letter: .BLOCK 1 ;global variable #1c 


0004 490003 main: CHARI letter,d ;Cin >> letter 

0007 C00000 LDA 0x0000, i 

000A D10003 while: LDBYTEA letter,d while (letter != '*') 
000D B0002A CPA m4 

0010 0A001C BREQ endWh 

0013 510003 CHARO letter,d : cout << letter 
0016 490003 CHARI letter,d : cin >> letter 
0019 04000A BR while 

001C 00 endWh: STOP 

001D . END 


图 6-10 (2%) 





对 while 语句 的 测试 是 在 循环 顶部 用 条 件 转 移 实 现 的 。 这 个 程序 检测 一 个 字符 值 ， 它 是 1 
字 节 的 量 。0007 处 的 装 和 人 指令 清除 累加 器 中 的 两 个 字 节 ， 这 样 000A 的 装 和 人 字 节 指令 执行 后 ， 


最 高 有 效 字 节 将 是 00 (hex)。 必 须 保 证 最 高 有 


51 
效 字 节 是 0， 因 为 比较 指令 比较 整个 字 。 Sie: Ga pi 
每 个 while 循环 要 以 一 个 无 条 件 分 支 结 S2 S2 
束 ， 回 到 循环 顶部 的 测试 ，0019 的 分 支 把 控 h 
制 带 回 开始 处 的 测试 。 图 6-11 展示 了 在 两 层 a) HOL6 层 的 结构 b) 图 6-10 在 Asmb5 层 的 结构 
上 的 while 语句 结构 。 图 6-11 Asmb5 层 的 while 语句 结构 


6.2.5 翻译 do 循环 


高 速 这 警 停 在 一 个 标识 后 面 ， 司 机 以 20 米 / 秒 超速 通过 ， 当 这 个 司机 沿 着 公路 驶 离 40 米 
后 ， 巡 警 以 25 米 / 秒 的 速度 去 追赶 超速 违法 者 ， 这 警 在 离 标识 多 远 的 地 方 能 追 上 超速 者 ? 

图 6-12 的 程序 模拟 解决 这 个 问题 ， 它 和 图 2-14 的 程序 一 样 。cop 和 driver 的 值 是 两 
者 的 位 置 ， 初 始 值 分 别 是 0 和 40。do 循环 的 每 次 执行 表示 时 间 过 去 1 秒 ， 在 此 期 间 巡 警 行 


进 25 米 ， 超 速 者 行进 20 米 ， 一 直 持续 到 巡警 追 上 超速 者 。 
高 级 语言 
#include <iostream> 


using namespace std; 


int cop; 


int driver; 


int main () { 
cop = 0; 
driver = 40; 


图 6-12 HOL6 和 Asmbs 层 的 do 语句 。 这 个 C++ 程序 来 自 图 2-14 
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do { 
cop += 25; 
driver += 20; 
} 
while (cop < driver); 
cout << cop; 
return 0; 
} 


汇编 语言 
0000 040007 main 


0003 0000 cop: 2 sglobal variable #2d 
0005 0000 driver: 2 ;global variable #2d 


0007 C00000 main: 0,7 Cop. = 0 

000A £10003 cop,d 

000D C00028 40,7 ;driver = 40 
0010 £10005 driver,d 

0013 C10003 : cop,d : cop += 25 
0016 700019 25,1 

0019 £10003 cop,d 

001C C10005 driver,d ; driver += 20 
OO1F 700014 20,7 

0022 £10005 driver,d 

0025 C10003 cop,d ;While (cop < driver) 
0028 B10005 driver,d 

002B 080013 do 

002E 390003 cop,d ;cout << cop 
0031 00 

0032 





图 6-12 ( 续 ) 


do 语句 的 测试 在 循环 的 底部 。 在 这 个 程序 中 ， 编 译 句 把 while 转换 成 LDA、CPA、BRLT 
序列 。 如 果 N 位 被 置 为 1，BRLT 执行 转移 。 由 于 CPA 计算 两 者 之 间 的 差异 cop-driver， 所 


以 如 果 Sl 
cop - driver < 0 ae A a 
| } Cl | 
即 cop < driver while (Cl) 
N 位 被 置 为 1。 这 是 循环 重复 的 条 件 。 图 6-13 展 53 53 
示 了 在 第 6 层 和 第 5 层 的 do 语句 结构 。 a) HOL6 层 的 结构 b) 图 6-12 在 Asmb5 层 的 结构 


图 6-13 ” Asmb5 层 的 do 语句 结构 
6.2.6 Miz for 循环 


for 语句 类 似 于 while 语句 ， 两 者 的 测试 都 是 在 循环 的 顶部 ， 编 译 器 必须 生成 代码 来 初 
始 化 和 有 递增 控制 变量 。 图 6-14 展示 了 编译 器 怎样 生成 for 语句 代码 ， 它 把 for 语句 翻译 成 
下 列 的 Asmb5 层 序列 : 
初始 化 控制 变量 。 
测试 控制 变量 。 
执行 循环 体 。 
递增 控制 变量 。 


166 常 四 记分 


© 转移 到 测试 。 


高 级 语言 
#include <iostream> 
uSing namespace std; 


int main () { 
tne 3% 


for (j = 0; 
cout << 


COUE << 73 
return 0; 


} 


汇编 语言 
0000 040003 


j - 3>=0 
也 即 
j >= 3 


BRGE 转移 出 循环 。 


680002 
C00000 
E30000 
B00003 
0E0027 
410034 
380000 
50000A 
C30000 
700001 
£30000 
04000C 


410034 endFor: 


3B0000 
50000A 
600002 
00 
6A203D 
2000 


i < Se 


g = " 


=" << j << endl; 


msg: 


LHe (RSA) 


iach) { 


BR 


. EQUATE 0 


SUBSP 
LDA 
STA 
CPA 
BRGE 
STRO 
DECO 
CHARO 
LDA 
ADDA 
STA 
BR 
STRO 
DECO 
CHARO 
ADDSP 
STOP 


-ASCII 


. END 





<< j << endl; 


main 
;local variable #2d 


;allocate #j 
;for (j = 0 


1 = 3 


cout << Yj =" 
<< j 
<< end] 
j++) 


scout << "j =" 
<< j 

: << end] 

sdeallocate #j 


| en \x00" 


图 6-14 AsmbS Je for 语句 结构 


在 这 个 程序 中 ，CPA 计算 j - 3， 如 果 N 位 为 0， 即 如 果 


j 等 于 0、1 和 2， 循 环 体 各 执行 一 次 ， 最 后 一 次 穿 过 循环 ，j 增加 到 3， 循 环 后 面 的 输 


出 语句 要 写 这 个 值 。 


6.2.7 ”面条 代码 


在 汇编 层 ， 程 序 员 可 以 写 出 和 C++ 中 并 不 对 应 的 控制 结构 。 图 6-15 展示 了 一 个 可 能 的 
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控制 流 ， 它 在 许多 HOL6 层 语 言 中 都 不 可 能 直接 存在 。 检 测 条 件 C1 ， 如 果 为 真 ， 转 移 到 一 


个 测试 条 件 为 C2 的 循环 中 。C++ 中 不 能 直接 写 出 这 样 的 控制 流 。 

编译 器 生成 的 汇编 语言 程序 通 稼 比 人 们 和 直接 用 汇编 语言 写 的 程 
序 长 。 不 仅 如 此 ,执行 也 更 慢 。 如 果 程 序 员 能 比 编译 髓 写 出 更 短 更 
快 的 汇编 语言 程序 ， 那 么 为 什么 人 们 还 要 用 高 级 语言 编程 呢 ? 一 个 
原因 是 如 第 5 草 讲 到 的 编译 需 进 行 类 型 检查 的 能 力 ， 另 一 个 原因 是 
如 果 人 允许 程序 员 自 由 使 用 原始 转移 指令 ， 这 将 给 他 们 增加 额外 的 责 
任 负 担 。 如 果 在 Asmb5 层 写 程序 时 不 够 仔细 ， 转 移 指令 会 失去 控 
制 ， 如 下 一 个 例子 出 现 的 情况 。 

图 6-16 的 程序 是 一 个 极端 的 例子 ,无 限制 地 使 用 原始 转移 指 


Sl 
Cl 


S4 


图 6-15 很 多 HOL6 语言 
里 都 不 可 能 直 
接 有 的 控制 流 


令 就 会 产生 这 些 问 题 。 由 于 没有 注释 和 缩 进 以 及 转移 类 型 不 一 致 ， 所 以 程序 很 难 理解 。 实 际 


上 这 个 程序 执行 一 个 非常 简单 的 任务 ， 你 能 看 出 它 是 什么 吗 ? 


040009 
0000 
0000 
0000 


310005 
310007 
C10005 
B10007 
08002A 
310003 
C10003 
B10007 
080074 
040065 
E10007 
310003 


390007 L6: 


图 6-16 一 个 神秘 的 程序 
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C10003 
B10005 
080049 


390005 L8: 
390003 L9: 
00 





图 6-16 ( 续 ) 


C++ 中 的 if 语句 或 者 循环 体 是 一 个 语句 块 ， 有 时 它 包 含 在 用 花 括 号 {} 括 起 来 的 复合 
语句 中 。 其 他 的 if 语句 和 循环 可 以 完全 藤 套 在 这 些 块 中 。 图 6-17a 是 这 种 情形 的 示意 图 。 
REWE if/else, switch, while, do All for 语句 中 的 控制 流 称 为 结构 化 控制 流 。 

这 个 神秘 程序 中 的 分 支 不 对 应 于 C++ 的 结构 化 控制 结 
构 。 尽 管 对 于 执行 预期 任务 来 说 ， 这 个 程序 的 逻辑 是 正确 的 ， 
但 是 由 于 分 支 语 句 到 处 转移 ， 很 难 理解 。 这 种 程序 叫 作 面 条 - 
代码 。 如 果 从 每 条 分 支 语 句 画 一 个 到 转移 到 语句 的 箭头 ， 

这 张 图 看 上 去 就 像 一 硕 面 条 ， 如 图 6-17b Fra. 

用 非 结构 化 分 支 有 可 能 写 出 高 效 的 程序 ， 这 样 的 程序 比 
用 结构 化 控制 流 的 高 级 语言 写 的 程序 执行 得 更 快 ， 需 要 的 内 ”结构 化 流 b) 面条 代码 
存 更 少 。 有 些 特殊 的 应 用 程序 对 效率 有 特别 的 要 求 ， 可 以 直 图 6-17 两 种 不 同 风格 的 控制 流 
接 用 汇编 语言 来 编写 。 

理解 平衡 执行 时 间 和 内 存 占用 是 一 件 难事 。 当 程序 难 理 解 时 ， 它 们 也 就 难 写 ， 难 调试 ， 
难 修 改 。 这 是 个 经 济 问 题 ， 编 写 、 调 试 、 修 改 都 是 需要 大 量 劳力 的 工作 ， 也 是 很 昂贵 的 。 你 
一 定 会 问 提高 的 这 点 效率 是 不 是 值得 花费 更 高 的 成 本 。 


6.2.8 早期 语言 中 的 控制 流 


在 结构 化 控制 流出 现 前 ， 计 算 机 已 经 存在 了 很 多 年 。 在 早期 没有 高 级 语言 的 时 候 ， 人 人 
都 用 汇编 语言 编程 。 按 今天 的 标准 ， 那 时 计算 机 内 存 非 常 昂贵 ，CPU 速度 很 慢 ， 效 率 是 至 
关 重 要 的 。 由 于 还 没有 产生 大 的 软件 ， 所 以 还 没有 意识 到 程序 的 维护 问题 。 

第 一 个 广泛 应 用 的 高 级 语言 是 20 世纪 50 年 代 开 发 的 FORTRAN。 因 为 那 时 的 人 们 习惯 
使 用 分 支 指令 ， 所 以 把 它们 也 包括 在 这 种 语言 中 。FORTRAN 中 的 无 条 件 分 支 是 

GOTO 260 


这 里 260 是 另 一 条 语句 的 语句 号 ， 它 称 为 goto 语句 。 条 件 分 支 是 





IF (NUMBER .GE. 100) GOTO 500 


这 里 .GE. 的 意思 是 “大 于 或 等 于 ”， 这 条 语句 比较 变量 NUMBER 和 100， 如 果 大 于 或 等 于 
100， 那 么 下 一 条 执行 的 语句 就 是 编号 500 的 语句 ， 否 则 执行 IF 后 面 的 那 条 语句 。 
相对 于 Asmb5 层 分 支 指 令 的 FORTRAN 分 文 语 句 IF 是 一 个 很 大 的 改进 ， 它 不 需要 一 
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个 单独 的 比较 指令 来 设置 状态 位 。 但 是 可 以 看 到 这 个 控制 流 和 Asmb5 层 的 分 支 还 是 非常 类 
似 的 : 如 果 测 试 为 真 ， 执 行 60T0; 否则 ， 继 续 执 行 下 一 条 指令 

随 着 开发 出 更 多 的 软件 ， 人 们 注意 到 把 语句 组 成 块 ， 用 在 if 语句 和 循环 中 会 很 方便 。 
在 这 方面 取得 进步 最 著名 的 是 1960 年 开发 的 ALGOL-60， 这 是 第 一 个 广泛 应 用 块 结 构 的 语 
言 ， 尽 管 它 主 要 在 欧洲 流行 。 


6.2.9 结构 化 编程 定律 


前 几 节 展示 了 高 级 语言 结构 化 控制 流 怎样 被 翻译 为 低层 的 原始 分 支 语 句 ， 同 时 也 展示 了 怎 
样 在 低层 写 出 没有 对 应 结构 化 结构 的 分 支 。 这 提出 了 一 个 有 趣 而 实际 的 问题 : 可 以 用 goto 语 
句 写 出 一 些 算法 执行 结构 化 结构 不 能 执行 的 处 理 吗 ? 也 就 是 说 ， 如 果 限 定 使 用 结构 化 控制 流 ， 
会 有 一 些 问题 你 无 法 解决 ， 而 如 果 人 允许 使 用 非 结构 化 的 goto， 这 些 问 题 就 可 以 解决 吗 ? 

1966 年 ，Corrado Bohm 和 Giuseppe Jacopini 在 一 篇 计算 机 科学 杂志 文章 中 回答 了 这 个 
问题 ”。 他 们 从 数学 上 证 明了 任何 含有 goto 语句 的 算法 ， 不 管 多 么 复杂 多 么 无 结构 ， 都 可 以 
HREH if 语句 和 while 循环 来 编写 。 他 们 的 结论 称 为 结构 化 编程 定律 。 

Bohm 和 Jacopini 的 论文 高 度 理论 化 ， 起 初 没 有 引起 太 多 的 关注 ， 因 为 程序 员 通 常 不 希 
望 限制 他 们 使 用 goto 语句 的 自由 。Bohm 和 Jacopini 展示 了 用 if AM while 循环 可 以 做 
什么 , 但 是 没有 回答 为 什么 程序 员 要 这 样 限制 自己 。 

不 管 怎样 ， 人 们 开始 尝试 这 个 理念 。 他 们 会 拿 一 个 面条 代码 算法 ， 试 着 用 不 带 goto if 
句 的 结构 化 控制 流 来 重 写 它 。 通 常 新 写 的 程序 比 原来 的 更 清晰 ， 偶 尔 其 至 更 高 效 。 


6.2.10 goto 争论 


Bohm 和 Jacopini Wit CAAA IA, fay JRA EFL TAK (Technological University 
at Eindhoven) 的 Edsger W. Dijkstra 给 同一 ae WS fa. fe PRA SSA DWE: 
优秀 的 程序 员 比 差 的 程序 员 更 少 使 用 goto 语句 2 。 


Edsger Dijkstra 
1930 年 Dijkstra + F Rotterdam 的 一 个 荷兰 化 学 家 家 庭 ， 成 长 过 程 中 一 直 对 世界 有 
形式 主义 的 偏好 。 在 荷兰 莱 顿 大 学 (University of Leiden) 学 习 时 ， pe 二 = 
Dijkstra 计划 以 物理 学 作为 他 的 事业 。 但 是 他 的 父亲 听 说 在 英国 创 2 
桥 有 一 个 关于 计算 的 夏季 课程 ，Dijkstra 就 在 1950 年 计算 潮流 刚刚 ”i 


开始 兴起 的 时 候 投 身 其 中 。 

Dijkstra 对 编程 最 有 名 的 贡献 之 一 就 是 强烈 拥护 结构 化 编程 定 
律 ， 正 如 他 那 封 有 名 的 批评 goto 语句 的 信 表 明 的 那样 。 他 素 有 直 
抒 胸 腾 的 名 声 ， 通 常 以 大 多 数 人 无 法 忘怀 的 煽动 性 或 戏剧 性 的 方式 
来 表达 。 例 如 ，Dijkstra 曾经 说 过 :“ 使 用 COBOL 会 致 人 脑残 。 因 
此 ， 教 授 COBOL 应 该 被 认定 为 犯罪 。 他 不 止 批 评 过 一 种 语言 ， 





© Corrado Bohm and Giuseppe Jacopini, “ Flow-Diagrams,Turing Machines and Languages with Only Two 
Formation Rules,” Communications of the ACM 9 (May 1966): 366-371. . 

© Edsger W. Dijkstra, “ Goto Statement Considered Harmful,” Communications of the ACM 11 (March 1968): 
147-648. 出 版 得 到 许可 。 
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他 还 说 过 :“ 如 果 学 生 曾 经 接触 过 BASIC 语言 ， 基 本 上 就 不 可 能 再 教会 他 们 好 的 编程 方法 
了 。 因 为 作为 可 能 的 程序 员 ， 他 们 的 智力 已 经 受 损 ， 不 可 能 再 恢复 了 。 

除了 在 语言 设计 上 的 工作 外 ，Dijkstra 还 以 他 在 程序 正确 性 证 明 方 面 的 工作 闻名 。 程 
序 正 确 性 领域 是 把 数学 应 用 到 计算 机 编程 上 。 研 究 人 员 试 图 构造 一 种 语言 和 证 明 技 术 ， 用 
于 无 条 件 证 明 程 序 会 按照 它 的 说 明 执 行 ， 完 全 没有 错误 。 无 需 资 言 ， 无 论 你 的 程序 是 客户 
记 账 还 是 飞行 控制 系统 ， 能 够 证 明 程 序 具 有 这 样 的 属性 都 是 极其 有 价值 的 。 


Dijkstra 实际 上 对 计算 机 科学 的 每 个 领域 都 有 所 涉猎 。 他 发 明了 信号 量 ， 本 书 第 8 章 
中 会 讲述 到 ， 还 发 明了 一 个 解决 最 短路 径 问 题 的 著名 算法 。1972 年 ， 国 际 计算 机 学 会 
(ACM) 为 了 表彰 Dijkstra 对 计算 机 领域 的 贡献 ， 授 予 他 图 灵 奖 。 在 与 癌症 斗争 了 多 年 之 
后 ，Dijkstra 于 2002 年 在 荷兰 Nuenen 的 家 中 去 世 。 

“计算 机 是 否 能 思考 这 个 问题 就 像 潜水 艇 是 否 会 游泳 一 样 。” 





—Edsger Dijkstra 


他 的 观点 是 ， 程 序 中 大 量 使 用 goto 语句 表示 质量 很 低 。 部 分 原文 如 下 : 

数 年 来 ， 我 越 来 越 多 地 观察 到 程序 员 的 质量 与 他 们 写 出 的 程序 中 goto 语句 的 

密集 程度 成 反比 。 最 近 ， 我 发 现 了 为 什么 goto 语句 的 使 用 有 极 糟 糕 的 影响 ， 因 此 

我 确信 应 该 从 所 有 高 级 编程 语言 ( 即 任何 语言 ， 也 许 除 了 纯 机 器 代码 外 ) 中 废除 

goto 语句 ……goto 语句 所 处 的 位 置 太 原始 ， 太 容 易 把 程序 搞 得 一 团 糟 。 

为 了 证 明 这 些 观 点 ，Dijkstra 开发 了 用 一 套 坐 标 来 描述 程序 进展 的 理念 。 当 人 们 想 理解 
一 个 程序 时 ， 他 必须 在 心理 上 ， 或 许 是 无 意识 地 ， 维 护 这 套 坐 标 。Dijkstra 展示 了 用 结构 化 
控制 流 比 用 非 结 构 化 goto 语句 维护 这 些 坐 标 要 简单 得 多 ， 因 此 他 能 精确 指出 结构 化 控制 流 
更 容易 理解 的 原因 。 

Dijkstra 知道 废除 goto 语句 这 个 理念 并 不 新 鲜 ， 他 提 到 了 几 个 在 这 个 事情 上 影响 他 的 几 
个 人 ， 其 中 之 一 是 致力 于 ALGOL-60 语言 的 Niklaus Wirth. 

Dijkstra 的 信 引 起 了 一 场 反 对 风暴 ， 这 就 是 现在 著名 的 goto 争论 。 理 论 上 可 以 不 用 goto 
编程 是 一 回 事 ， 但 主张 从 FORTRAN 这 样 的 高 级 语言 中 废除 goto 完全 是 另外 一 回 事 。 

旧 的 观念 很 难 消 失 ， 不 管 怎样 争论 逐渐 平息 了 。 现 在 一 般 认 为 Dijkstra 实际 上 是 正确 的 。 
原因 是 成 本 。 当 软件 经 理 开 始 和 其 他 结构 设计 概念 一 起 运用 结构 化 控制 流 准 则 时 ， 他 们 发 
现 这 样 的 软件 开发 、 调 试 和 维护 花费 很 低 ， 这 使 得 额外 的 内 存 需 求 和 执行 时 间 变 得 有 价值 。 

FORTRAN 77 是 在 1977 年 制定 的 一 个 更 新 的 FORTRAN IRA, goto 争论 影响 到 了 它 的 
设计 。 它 的 块 风格 、 带 ELSE 部 分 的 IF 语句 ， 类 似 于 C+, Bin, 

IF (NUMBER .GE. 100) THEN 

语句 1 

ELSE 

语句 2 

ENDIF 
我 们 可 以 用 FORTRAN 77 编写 没有 goto 的 IF 语句 。 

要 记 住 ， 程 序 中 不 用 goto 不 能 保证 程序 有 好 的 结构 。 在 只 需要 1 个 或 者 2 个 藤 套 时 ， 
有 可 能 写 出 有 3 或 4 个 if 语句 和 while 循环 艇 套 的 程序 。 此 外 ， 如 果 任 何 层 上 的 语言 只 
包含 goto 语句 来 改变 控制 流 ， 它 也 可 以 总 是 以 结构 化 的 方式 来 实现 if 语句 和 while 循环 。 
这 正 是 C++ 编译 器 把 程序 从 HOL6 层 翻译 到 Asmb5 层 时 做 的 事情 。 
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6.3 ”函数 调用 和 参数 


C++ 函数 调用 把 控制 流 改 变 到 了 函数 的 第 一 条 可 执行 语句 ， 在 函数 结束 时 ， 控 制 回 到 郴 
数 调 用 下 面 的 语句 。 编 译 器 用 CALL 指令 实现 函数 调用 ，CALL 指令 有 在 运行 时 栈 存 储 返 回 
地 址 的 机 制 。 它 用 RETn 实现 返回 到 调用 语句 ，RETn 用 保存 在 运行 时 栈 的 返回 地 址 来 确定 
接 下 来 执行 哪 条 指令 。 


6.3.1 翻译 函数 调用 
图 6-18 展示 了 编译 器 如 何 翻译 不 带 参 数 的 函数 调用 ， 程 序 输出 3 个 星 号 三 角形 。 


高 级 语言 
#include <iostream> 
using namespace std; 


void printTri () { 
cout << "*" << endl; 
cout << "“**" << endl; 
cout << "***" << endl: 
} 


int main () { 
printTri (); 
orintiri ©): 
printirt (Js 
return 0; 

} 

汇编 语言 


0000 04001F BR main 


sR votd printir® (2 
410016 printTri:STRO msgl,d scout << =* 
50000A CHARO “An 1 ; << end] 
410018 STRO msg2,d scout << TAA" 
50000A CHARO en ; << end] 
410018 STRO msg3,d scout << "žžk" 
50000A CHARO mn ; << endl 
58 RETO 
2A00 + msgl: -ASCII "*\x00" 
2A2A00 msg2: „ASCII “**\x00" 
Z2A2A2A msg3: ASCII "***\x90" 
00 


。 大 六 次 交大 大 大 int main () 
160003 main: CALL printTri sprintir: (3 
160003 CALL printTri sprintTri () 
160003 CALL printTri ;printTri () 
00 STOP 
. END 





图 6-18 HOL6 层 和 Asmb5 层 的 过 程 调 用 
CALL 指令 把 程序 计数 器 的 内 容 压 人 运行 时 栈 ， 然 后 把 操作 数 装 人 程序 计数 项 。CALL 指 
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R 


令 的 RTL 描述 是 

SP + SP-2; Mem[SP] < PC; PC < Oprnd 
实际 上 ， 这 个 过 程 调 用 的 返回 地 址 被 压 人 栈 ， 然 后 执行 一 个 到 该 程序 的 转移 。 

和 分 支 指令 一 样 ，CALL 通常 使 用 立即 数 寻 址 方式 执行 ， 这 种 情况 下 操作 数 就 是 操作 数 
指示 符 。 如 果 不 指定 寻 址 方式 ，Pep/8 汇编 程序 将 假设 使 用 立即 数 寻 址 。 

图 5-2 展示 了 RETn 指令 ， 有 一 个 3 位 nnn 字段 。 通 常情 况 下 ， 一 个 程序 可 以 有 任意 数 
量 的 局 部 变量 。 这 里 有 8 种 RETn 指令 ， 名 为 RETO、RET1、…… 、RET7， 这 里 的 n 是 程序 
局 部 变量 占用 的 字 节 数 。 图 6-18 的 PrintTri 过 程 没 有 局 部 变量 ， 因 此 编译 器 在 0015 生成 
RET0。RETn AY RTL 描述 是 : 

BP << SP+ PC MGnLSP SP + SP +2 

首先 ， 指 令 通 过 栈 指 针 加 mn 释放 局 部 变量 的 存储 。 释 放 之 后 ,返回 地 址 就 应 该 在 运行 
时 栈 顶 部 了 。 然 后 ， 指 令 把 返回 地 址 从 运行 时 栈 项 部 移 到 程序 计数 占 。 最 后 ， 给 栈 指针 加 
2， 这 是 出 栈 操作 。 当 然 ， 程 序 可 能 有 多 于 7 字 节 的 局 部 变量 ， 这 种 情况 下 ， 编 译 器 将 生成 
ADDSP 指令 来 释放 局 部 变量 的 存储 空间 。 

在 图 6-18 中 ， 


BR main 


把 001F 放 入 程序 计数 器 ， 因 此 下 一 条 要 执行 的 语句 是 在 001F 的 语句 ， 即 第 一 条 CALL 指 
令 。 对 图 6-1 中 程序 的 讨论 解释 了 栈 指针 怎样 初始 化 为 FBCF。 图 6-19 展示 了 执行 第 一 条 
CALL 语句 之 前 和 之 后 的 运行 时 栈 。 通 常 ， 栈 指针 的 初始 值 是 FBCF。 


PC FBCD | ? PC FBCD 
sp FBCF sp FBCF 


a) 第 一 条 CALL 执 行 之 前 b) 第 一 条 CALL 执 行 之 后 
图 6-19 图 6-18 中 第 一 条 CALL 指令 的 执行 


CALL 和 RETn 的 运行 严重 依赖 于 汉 : 诺 依 曼 运 行 周期 : BR. PERS. Seo PC. ATTA 
重复 ， 特 别 是 增加 PC 发 生 在 执行 前 ， 结 果 就 是 正在 执行 的 语句 并 不 是 地 址 在 程序 计数 器 中 
的 语句 ， 而 是 程序 计数 器 增加 前 取出 的 那 条 语句 ， 现 在 它 放 在 指令 寄存 器 中 。 这 个 为 什么 在 
CALL 和 RETn 的 执行 中 这 么 重要 呢 ? 

图 6-19a 显示 了 在 第 一 条 CALL 指令 执行 前 ， 程 序 计 数 器 的 内 容 为 0022， 这 不 是 第 一 条 
CALL 指令 的 地 址 ， 第 一 条 CALL 指令 的 地 址 001F。 为 什么 不 是 呢 ? 因为 程序 计数 器 在 执行 
CALL 前 增加 到 了 0022， 因 此 在 执行 第 一 条 CALL 指令 期 间 ， 程序 计 数 器 包含 的 正好 是 位 
于 CALL 指令 后 面 那 条 指令 在 主 存 中 的 地 址 。 

第 一 条 CALL 指令 执行 时 发 生 了 什么 呢 ? 首先 , SP <—SP-2 对 SP 减 2， 得 到 值 
FEED, 其 次 Mem[SP] <— PC 把 程序 计数 器 的 值 0022 放 入 主 存 中 地 址 FBCD 的 位 置 ， 即 运 

行 时 栈 顶 部 。 最 后 PC | Oprnd 把 0003 放 入 程序 计数 器 。 eii 
ae 所 以 结果 如 图 6-19b 所 示 。 

1+ 诺 依 曼 周 期 继续 下 一 个 取 指 。 但 是 现在 程序 计数 器 中 是 0003 ， 因 此 下 一 个 要 获取 
的 指令 是 地 址 0003 的 指令 ， 这 是 PrintTri 程序 的 第 一 条 指令 ， 执 行程 序 的 输出 指令 ， 生 
成 一 个 星 号 三 角 图 案 。 
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最 后 ， 地 址 0015 的 RET0 指令 执行 。 图 6-20a 显示 在 执行 RET0 之 前 程序 计数 器 的 内 
容 是 0016， 这 可 能 看 上 去 有 点 儿 奇 怪 ， 因 为 0016 甚至 不 是 一 条 指令 的 地 址 ， 它 是 字符 串 
“*Nx00” 的 地 址 。 为 什么 会 这 样 呢 ? 因为 RETO 是 一 个 一 元 指令 ，CPU 会 把 程序 计数 器 加 
1。 执 行 RETO 的 第 一 步 是 SP 所 SP+n， 由 于 n 为 0， 所 以 SP 加 0。 然 后 Mem[SP] < PC 
把 0022 放 入 程序 计数 器 。 最 后 ，SP | SP + 2 把 栈 指针 改变 回 FBCF。 


pc fone] recpfoo| rc FBCD [0022 
sp FBCF sp FBCF 


图 6-20 图 6-18 中 第 一 条 RETO 指令 的 执行 


冯 “ 诺 依 曼 周 期 继续 下 一 个 取 指 ， 但 这 时 程序 计数 器 包含 第 二 条 CALL 指令 的 地 址 ， 发 
生 和 第 一 个 调用 一 样 的 事件 序列 ， 在 输出 流 生成 男 一 个 星 号 三 角 图 案 。 第 三 个 调用 也 是 一 样 
的 情况 ， 这 之 后 执行 STOP 指令 。 注 意 在 STOP 指令 执行 后 ， 程 序 计 数 器 的 值 是 0029 而 不 是 
0028，0028 是 STOP 指令 的 地 址 。 

现在 你 应 该 明白 汉 :… 诺 依 曼 周期 中 为 什么 PC 增加 在 执行 之 前 了 吧 。 要 在 运行 时 栈 存储 
返回 地 址 ，CALL 指令 需要 存储 CALL 后 面 那 条 指令 的 地 址 。 只 有 CALL 语句 执行 前 程序 计数 
右 已 经 增加 了 才能 做 到 这 样 。 


6.32 ”用 全 局 变量 翻译 传 值 调 用 参数 


在 C++ 中 调用 一 个 空 函数 时 ,分配 过 程 是 

e KARE. 

o 压 人 返回 地 址 。 

o 压 人 局 部 变量 的 存储 空间 。 

在 HOL6 层 ， 在 栈 上 执行 这 些 操 作 的 指令 是 隐藏 的 。 程 序 员 只 写 图 数 调 用 ， 执 行 时 栈 分 
配 目 动 进 行 。 

然而 ,在 汇编 层 ， 翻 译 后 的 程序 必须 要 有 明确 的 指令 来 完成 这 些 分 配 。 图 6-21 的 程序 
和 图 2-16 的 程序 一 样 ， 是 一 个 输出 柱状 图 的 HOL6 层 程序 ， 以 及 它 对 应 的 Asmbs 层 翻译 程 
序 。 图 中 显示 了 压 人 参数 必需 的 Asmb5 层 语 句 ， 而 在 HOL6 层 是 不 需要 明确 写 出 来 的 。 


高 级 语言 
#include <iostream> 
using namespace std; 


int numPts; 
int value; 
int j: 
void printBar (int n) { 
int ki 
for (k = 1; k <= n; k+) { 
cout << °*"s 
} 





图 6-21 全 局 变量 的 传 值 调用 参数 
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Fo OF Bp 


LH (FSA) 


cout << endl; 


int main () { 


cin >> numPts; 
for (j= 1; j <= numPts; j++) { 


} 


cin >> 


value; 


printBar (value); 


return 0; 


汇编 语言 


0000 
0003 
0005 
0007 


04002B 
0000 
0000 
0000 


680002 
C00001 
£30000 
B30004 
100027 
50002A 
C30000 
700001 
E30000 
040012 
50000A 
5A 


310003 
C00001 
E10007 
B10003 
100058 
310005 
C10005 
E3FFFE 
680002 
160009 
600002 
C10007 
700001 
£10007 
040034 
00 


numPts: 
value: 

J: 
eer 
n: 

k: 
printBar: 


endForl: 


KK KKK 
» 


main: 


endFor2: 


BR 

.BLOCK 
.BLOCK 
.BLOCK 


;global variable #2d 
:global variable #2d 
;global variable #2d 


void printBar (int n) 


. EQUATE 4 
. EQUATE 0 
SUBSP 2, 
LDA Ls 
STA k 
CPA 
BRGT 
CHARO 
LDA 
ADDA 
STA 
BR 
CHARO 
RET2 


n,s 
endForl 
tag 

k , S 

Las 

K3 
forl 
"<A 23 


main () 
DECI 
LDA 
STA 
CPA 
BRGT 
DECI 
LDA 
STA 
SUBSP 
CALL 
ADDSP 
LDA 
ADDA 
STA 
BR 
STOP 
. END 


numPts,d 
Rat 

j.d 
numPts,d 
endFor2 
value,d 
value,d 
2 ae 

243 
printBar 
2 

j,d 

P 

j.d 

for2 


图 6-21 ( 续 ) 


;formal parameter #2d 
;local variable #2d 
;al1ocate #k 

for (k = J 


sk <= n 


EE 


cout << 
Kir? 


scout << end] 


;deallocate #k, pop retAddr 


:Cin >> numPts 
‘Tor (J = 1 


;j <= numPts 


cin >> value 
call by value 


: push #n 

- push retAddr 
; pop #n 

; j++) 
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调用 过 程 负责 压 人 实 参 以 及 执行 CALL，CALL 把 返回 地 址 压 人 栈 ， 被 调用 过 程 负 责 在 栈 
上 给 局 部 变量 分 配 存储 空间 。 被 调用 的 过 程 执行 后 ， 必 须 释 放 局 部 变量 的 存储 空间 ， 通 过 执 
ÍT RETn 弹出 返回 地 址 。 在 调用 过 程 可 以 继续 之 前 ， 一 定 要 释放 实 参 的 存储 空间 。 

总 的 来 说 ， 调 用 和 被 调用 过 程 会 完成 如 下 操作 : 

e 调用 压 人 实 参 (执行 SUBSP), 
调用 压 人 返回 地 址 (执行 CALL). 

被 调用 分 配 局 部 变量 (执行 SUBSP ) 。 

被 调用 执行 它 的 函数 体 。 

被 调用 释放 局 部 变量 ,弹出 返回 地 址 (执行 RETn )。 

调用 弹出 实 参 (执行 ADDSP )。 

注意 这 些 操作 的 对 称 性 ， 后 两 个 操作 以 相反 的 顺序 执行 前 3 个 操作 的 逆 操 作 ， 这 个 顺序 是 栈 
的 后 进 先 出 特性 导致 的 。 

HOL6 层 主 程序 的 全 局 变量 (numPts、value 和 j) 对 应 同样 的 Asmb5 层 符 号 ， 符 号 
值 分 别 是 0003、0005 和 0007， 这 是 保存 全 局 变量 运行 时 值 的 内 存单 元 地 址 。 图 6-22a © 
示 了 全 局 变量 ,左边 原来 写 地 址 的 地 方 现在 写 的 是 符号 名 。 全 局 变量 的 值 是 第 一 次 执行 
cin>>value 之 后 的 值 。 


numPts 
value value 2 
j y E. j 4 
SP .一 一 AL 
a) cin>>value 执 行 之 后 b) printBar 中 SUBSP 分 配 之 后 


图 6-22 全 局 变量 作为 传 值 调 用 参数 


WE n、 局 部 变量 k， 在 Asmb5 层 对 应 的 是 什么 呢 ? 不 是 绝对 地 址 而 是 栈 相 对 地 址 。 过 
Fe printBar 用 | 

n: .EQUATE 4 

k: . EQUATE 0 
来 定义 它们 。 记 住 .EQUATE 不 会 生成 目标 代码 ， 翻 译 时 汇编 器 不 给 它们 保留 存储 空间 ， 而 
是 在 运行 时 在 栈 上 为 n 和 k 分 配 存储 空间 。 十 进 制 数 4 和 0 是 过 程 执行 期 间 n 和 k AY 
移 量 ， 如 图 6-22 所 示 。 过 程 以 栈 相 对 寻 址 方式 来 引用 它们 。 

调用 过 程 中 与 过 程 调用 相对 应 的 语句 为 

LDA value,d 

STA SyS 

SUBSP 2,i 

CALL printBar 

ADDSP 2,i 

因为 参数 是 传 值 调用 的 全 局 变量 ， 所 以 LDA 用 直接 寻 址 ， 它 把 变量 value 的 运行 时 
(ATLA BIAS, FEA STA 把 它 压 人 栈 。 偶 移 量 是 -2， 因 为 value 是 一 个 2 字 节 的 整数 量 ， 
如 图 6-22a 所 示 。 

被 调用 过 程 中 与 过 程 调用 相对 应 的 语句 为 


SUBSP 2,71 


SP。w 0 be | k 
numPts 12 
EJ retAddr 
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RET2 

由 于 局 部 变量 k 是 2 字 节 的 整数 量 ， 所 以 SUBSP 减 去 2。 图 6-22a 展示 了 第 一 次 输入 
全 局 变量 value 后 、 第 一 次 过 程 调用 前 的 运行 时 栈 ， 它 直接 对 应 于 图 2-17d。 图 6-22b 展 
示 了 过 程 调用 后 的 栈 ， 直 接 对 应 于 图 2-17g。 注 意 在 图 2-17 中 标 为 ral 的 返回 地 址 ， 这 里 为 
0049， 是 跟 在 CALL 后 面 那 条 指令 的 汇编 语言 地 址 。 

n 的 栈 地 址 是 4， 因 为 返回 地 址 和 k 都 占用 2 字 节 。 如 果 有 更 多 的 局 部 变量 ， 那 么 n 的 
栈 地 址 会 相应 地 更 大 。 编 译 需 必须 根据 栈 上 数据 的 数量 和 大 小 来 计算 栈 地 址 。 

总 之 ， 要 用 全 局 变量 翻译 传 值 调用 参数 ， 编 译 器 以 如 下 方式 生成 代码 : 

e 压 人 实 参 ， 生 成 采用 直接 寻 址 方式 的 装 和 人 指令。 

e 访问 形 参 ， 生 成 采用 栈 相 对 寻 址 方式 的 指令 。 


6.3.3 用 局 部 变量 翻译 传 值 调用 参数 


除了 main 的 变量 是 局 部 变量 而 不 是 全 局 变量 之 外 ， 图 6-23 的 程序 和 图 6-21 的 程序 
是 完全 一 样 的 。 尽 管 这 个 程序 的 行为 很 像 图 6-21 的 程序 ， 但 是 内 存 模型 和 到 Asmb5 层 的 翻 
译 是 不 同 的 。 


#include <iostream> 
using namespace std; 


void printBar (int n) { 
int k; 
for (k= 1; k <= n; k++) { 
cout << "ws 
} 
‘cout << endl; 
} 


int main () { 
int numPts; 
int value; 
int j; 
cin >> numPts; 
for (j = 1; j <= numPts; j++) ({ 
cin >> value; 
printBar (value); 
} 
return 0; 
} 


汇编 语言 
00000 040025 BR main 


;太太 娘娘 娘娘 大 void printBar (int n) 
n: EQUATE 4 formal parameter #2d 
k: . EQUATE 0 ;1ocal variable #2d 





图 6-23 ”局 部 变量 作为 传 值 调用 参数 
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680002 printBar:SUBSP 2,i :allocate #k 
C00001 LDA i sfor (k = 1 
£30000 STA Ks 

B30004 CPA n,s ;k <= n 

100021 BRGT endForl 

50002A CHARO are ant : cout << Tw 
C30000 LDA cs > k++) 

700001 ADDA pai 

£30000 STA k,s 

04000C BR forl 

50000A endForl: CHARO es a scout << endl 
5A RET2 ;deallocate #k, pop retAddr 


e Kek k ke k k main () 


numPts: .EQUATE :local variable #2d 
value: . EQUATE ;local variable #2d 
jz . EQUATE :local variable #2d 
680006 main: SUBSP 6,i allocate #numPts #value #j 
330004 DECI numPts,s :Cin >> numPts 
C00001 LDA bel ‘for (j = 1 
£30000 STA j.s 
B30004 CPA numPts,s ;j <= numPts 
100055 BRGT endFor2 
330002 DECI value,s ; cin >> value 
C30002 LDA value,s ; call by value 
ESFFFE STA E IE 
680002 SUBSP 2%) ; push #n 
160003 CALL printBar : push retAddr 
600002 ADDSP 2,i ; pop #n 
C30000 LDA Fas : j++) 
700001 ADDA Baa 
E30000 STA Jys 
040031 BR for2 
600006 endFor2: ADDSP 6,i :deallocate #j #value #numPts 
00 STOP 
. END 





图 6-23 (5) 


可 以 看 到 图 6-21 和 图 6-23 中 的 返回 值 为 void (4) WAX printTri Æ HOL6 层 是 一 
样 ， 因 此 编译 器 为 这 两 个 版 本 生成 一 样 的 Asmbs 层 目标 代码 并 不 奇怪 。 两 个 程序 唯一 的 不 
同 是 main() 的 定义 。 图 6-24a 展示 了 主 程序 中 numPts、value 和 j 在 运行 时 栈 上 的 分 配 。 
图 6-24b 展示 了 printTri 第 一 次 被 调用 后 的 运行 时 栈 。 因 为 value 是 一 个 局 部 变量 ， 所 以 
编译 器 生成 使 用 栈 相 对 寻 址 方式 的 LDA value, s, 将 value 的 实际 值 压 人 形 参 n 的 栈 单 元 。 


value value 





a) cin>>value 执 行 之 后 b) printBar 中 SUBSP 分 配 之 后 
图 6-24 图 6-23 中 RETO 指令 的 第 一 次 执行 
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BZ, AT Ashe Ee ve AB, Sa PERE AON PA: 
© FAKS, AME ARAFAT ATES 
e 访问 形 参 ， 生 成 使 用 栈 相 对 寻 址 方式 的 指令 。 


6.3.4 翻译 非 空 函 数 调 用 


当 调 用 因数 时 ， 分 配 过 程 是 这 样 的 : 

© 压 人 返回 值 的 存储 空间 。 

e 压 人 实 参 。 

e 压 人 返回 地 址 。 

e 压 人 局 部 变量 的 存储 空间 。 

非 空 (non-void) 函数 调用 的 分 配 不 同 于 空 图 数 调 用 的 分 配 ， 必 须 为 返回 的 困 数 值 分 配 
额外 的 空间 。 


图 6-25 展示 了 一 个 递归 计算 二 项 式 系数 的 程序 ， 和 图 2-28 的 程序 一 样 。 它 是 基于 系数 
的 帕斯卡 三 角 ， 如 图 2-27 所 示 。 二 项 式 系 数 的 递归 定义 是 
b(n,0) = 1 
b(k,k) =1 
b(n,k) = b(n-1,k)+b(n-1,k-1) #FO0<k <n 


高 级 语言 
#include <iostream> 
using namespace std; 


int binCoeff (int n, int k) { 
int yl. y2: 
if ((k =—= 0) || (n = k)) { 
return 1; 
} 
else { 
yl = binCoeff (n - 1, k); // ra2 
yg = binCoeff (n= 1, k = Is // ra3 
return yl + y2; 
} 
} 


int main () { 
cout << “binCoeff (3, 1) = ~ << binCoeff (3, 1); // ral 
cout << endl; 
return 0; 

} 

汇编 语言 

00000 040065 BR main 


;大 太太 太太 太太 int binomCoeff (int n, int k) 

retVal: .EQUATE 10 sreturned value #2d 
.EQUATE 8 :formal parameter #2d 
‘EQUATE 6 ;formal parameter #2d 
. EQUATE 2 :local variable #2d 





图 6-25 HOLS 层 和 Asmbs 层 的 递归 非 空 函数 。 这 个 C++ 程序 来 自 图 2-28 
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y2: .EQUATE 0 ;local variable #2d 
680004 binCoeff:SUBSP 4,i ;allocate #y1 #y2 
C30006 if: LDA k , S ;if ((k == 0) 
0A0015 BREQ then 
C30008 LDA n,s si] (n = k)) 
B30006 CPA kS 
0C001C BRNE else 
C00001 LDA 1A return 1 
E3000A STA retVal,s 
5C RET4 sdeallocate #y2 #y1l, pop retAddr 
C30008 LDA n,s “puUsh n= 1 
800001 SUBA GA 
E3FFFC STA -4,5 
C30006 LDA k , S ;push k 
E3FFFA STA -6,5S 
680006 SUBSP 6,i ;push #retVal #n #k 
160003 CALL binCoeff ;binomCoeff (n - 1, k) 
600006 : ADDSP 6,i ;pop #k #n #retVal 
C3FFFE LDA -2,$ ;yl = binomCoeff (n - 1, k) 
£30002 STA yl,s 
C30008 LDA n,s ;push n - 1 
800001 SUBA l,i 
E3FFFC STA -4,S 
C30006 LDA Kss spush k - 1 
800001 SUBA 11 
E3FFFA STA *6,5 
680006 SUBSP 6,i ;push #retVal #n #k 
160003 CALL binCoeff :binomCoeff (n - 1, k - 1) 
600006 : ADDSP 6, i ;pop #k #n #retVal 
C3FFFE LDA -2,8 ;y2 = binomCoeff (n - 1, k - 1) 
E30000 STA y2,s 
C30002 LDA yl,s ;return yl + y2 
730000 ADDA y2,s 
E3000A STA retVal,s 
5C endIf: RET4 ;deallocate #y2 #yl, pop retAddr 


;大大 交火 火 火 类 main () 


410084 main: STRO msg,d scout << “binCoeff (3, 1) =" 
C00003 LDA re ;push 3 

ESFFFC STA -4,5s 

C00001 LDA iil ;push 1 

E3FFFA STA -6,'S 

680006 SUBSP 6, i ;push #retVal #n #k 
160003 CALL binCoeff :binomCoeff (3, 1) 
600006 : ADDSP 6,i ;pop #k #n #retVal 
3BFFFE DECO “245 s< binCoeff (3, 1) 
50000A CHARO “AN ;Cout << endl 

00 STOP 

62696E : .ASCII “binCoeff (3, 1) = \x00" 


. END 





图 6-25 ( 续 ) 


函数 使 用 if 语句 来 测试 基本 的 情况 ， 测 试 条 件 使 用 了 布尔 运算 符 OR。 如 果 基 本 情况 都 
不 符合 ， 它 会 递归 调用 它 自己 两 次 一 一 一 次 计算 b(n-1, 月 ， 一 次 计算 b(n-1, k-1). Al 6-26 展 
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示 了 主 程 序 中 一 个 以 实 参 (3,1) DAP ERIS TATA. PRR PRA RAK, BRUT 
是 (2, 1) 和 (1, 1)， 然 后 返回 。 再 执行 参数 为 (1, 0 ) 的 调用 ， 接 着 是 第 二 次 返回 ， 以 此 类 推 。 
图 6-26 展示 了 第 二 次 返回 后 汇编 层 的 运行 时 栈 ， 它 正好 对 应 于 图 2-29g 的 HOL6 层 示 意图 。 
图 2-29g 中 标号 为 ra2 的 返回 地 址 在 图 6-26 中 是 0031， 这 是 函数 中 第 一 次 CALL 后 面 指令 的 地 
址 。 类 似 地 ， 图 2-29 中 标号 为 ral 的 地 址 在 图 6-26 中 是 007A。 

主 程序 开始 时 ， 栈 指针 是 初始 值 ， 第 一 个 实 参 的 栈 偏 移 
量 是 -4， 第 二 个 实 参 的 是 -6。 如 果 是 在 一 个 过 程 调用 GE 
回 值 为 空 的 函数 ) 中 ， 两 个 实 参 的 偏 移 量 分 别 是 -2 和 -4。 
它们 比 前 面 对 应 的 偏 移 量 大 2， 因为 这 个 函数 的 返回 值 会 在 
运行 时 栈 上 占 2 字 节 。0074 的 SUBSP 指令 分 配 6 字 节 ， 两 
个 实 参 每 个 2 字 节 ， 返 回 值 2 字 节 。 

当 函 数 将 控制 返回 到 007A AY ADDSP AY, PRA ASI El 
值 是 栈 上 两 个 实 参 的 下 面 。ADDSP 给 栈 指针 加 6， 弹 出 两 个 
实 参 和 返回 值 ， 于 是 指针 指向 返回 值 下 面 的 那个 单元 。 这 样 
DECO 用 栈 相 对 寻 址 方式 输出 这 个 值 ， 使 用 偏 移 量 -2。 

这 个 孙 数 按照 标准 技术 通过 分 配 实 参 来 调用 它 自 己 。 对 图 6-26 第 二 次 返回 后 ， 图 6-25 
于 第 一 次 递归 调用 ， 它 计算 n-1 和 k， 把 这 两 个 值 和 返回 值 的 运行 时 栈 
的 存储 空间 一 起 压 人 栈 。 返 回 后 ， 序 列 

ADDSP 6,7 ;pop #k #n #retVal 

LDA “ZS :yl = binomCoeff (n - 1, k) 

STA yl,s 
弹出 两 个 实 参 和 返回 值 ， 将 返回 值 赋 给 y1。 对 于 第 二 次 调用 ， 类 似 地 把 n-1 和 k-1 KA, 
把 返回 值 赋 给 y2。 


6.35 用 全 局 变量 翻译 传 引 用 调用 参数 


C++ 提供 传 引 用 调用 参数 ， 这 样 被 调用 过 程 可 以 改变 调用 过 程 中 实 参 的 值 。 图 2-20 展 
示 了 一 个 HOL6 层 的 程序 ， 使 用 传 引 用 调用 对 两 个 全 局 变量 a M b 排序 。 图 6-27 给 出 了 这 
个 程序 ， 以 及 编译 器 产生 的 目标 程序 。 


高 级 语言 


#include <iostream> 
using namespace std; 





int a, b; 


void swap (int& r, int& s) { 


int temp; 
temp = r; 
r= Ss 

s = temp; 


} 
void order (int& x, int& y) { 
if (x > y) { 
Swap (x, y); 


图 6-27 使 用 全 局 变量 的 传 引用 调用 参数 。C++ 程序 来 自 图 2-20 





BO? RMAZAILRAZ 181 


int main () { 
cout << “Enter an integer: "; 
cin >> a; 
cout << "Enter an integer: "; 


cin >> b; 
order (a, b); 
cout << "Ordered they are: " << a << ", " << b << endl: // ral 
return 0; 


} 


汇编 语言 


0000 
0003 
0005 


04003C 
0000 
0000 


680002 
C40006 
E30000 
C40004 
E40006 
C30000 
E40004 
5A 


C40004 
B40002 
060038 
C30004 
E3FFFE 
C30002 
E3FFFC 
680004 
160007 
600004 
58 


41006D 
310003 
41006D 
310005 
C00003 
ESFFFE 
C00005 


BR 
a: .BLOCK 
b : .BLOCK 


:global variable #2d 
;global variable #2d 


Sw Void swap CINCA T. TTA 5) 
.EQUATE 6 
„EQUATE 4 
„EQUATE 0 


SUBSP 
LDA 
STA 
LDA 
STA 
LDA 
STA 
RET2 


;* 太 太太 太太 大 void order (int& x, 


ral 
sT 
temp,s 
s,sf 
Pst 
temp,s 
S ST 


„EQUATE 4 
.EQUATE 2 


LDA 
CPA 
BRLE 
LDA 
STA 
LDA 
STA 
SUBSP 
CALL 
ADDSP 
RETO 


CT main () 
STRO 
DECI 
STRO 
DECI 
LDA 

STA 

LDA 


main: 


XST 
y,sf 
endif 
KS 
“2,5 
yas 
-4,S 
4,7 
Swap 
4,1 


msgl,d 
a,d 
msgl,d 
b,d 
os 
“2 6 
b, i 


图 6-27 ( 续 ) 


;formal parameter #2h 
:formal parameter #2h 
;local variable #2d 
;allocate #temp 

;temp = r 


spas 


;S = temp 


;deallocate #temp, pop retAddr 


int& y) 


;formal parameter #2h 
;formal parameter #2h 
sif (x > y) 


push x 
push y 


push #r #s 
: swap (x, y) 
; pop #s #r 
;pop retAddr 


scout << "Enter an integer: ” 
SEH >> a 

scout << “Enter an integer: " 
Sein >> D 

;push the address of a 


;push the address of b 
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ESFFFC STA “4s 

680004 SUBSP 4, ;push #x dy 

16001D CALL order ;order (a, b) 
ADDSP 4, i ;pop #y #x 
STRO msg2,d scout << “Ordered they are: ” 
DECO a,d : a 
STRO msg3,d 3 
DECO b,d : b 
CHARO NA oo ; end] 
STOP 

456E74 msgl: .ASCII “Enter an integer: \x00" 


4F7264 msg2: -ASCII "Ordered they are: \x00" 


2C2000 msg3: ASCII 7. W007 
. END 





图 6-27 ( 续 ) 


主 程序 调用 一 个 叫 作 order 的 过 程 ， 它 的 两 个 形 参 x 和 y 是 传 引 用 调用 。order 调用 
swap, swap 完成 实际 的 交换 。swap 有 两 个 传 引用 调用 参数 r 和 s， 人 参数 r 引用 参数 s， 参 
数 s 引用 参数 a。 程 序 员 使 用 传 引用 调用 ， 当 过 程 swap 改变 r 的 时 候 ， 它 实际 上 改变 a， 
因为 r 引用 a (通过 s)。 | 

C++ 的 传 引用 调用 参数 不 同 于 传 值 调用 参数 ， 因 为 在 调用 过 程 中 实 参 提供 的 是 变量 的 引 
用 而 不 是 变量 的 值 。 在 汇编 层 ， 把 实 参 压 人 栈 的 代码 会 把 实 参 的 地 址 压 人 。 当 实 参 为 全 局 变 
量 时 ， 它 的 地 址 就 是 它 符号 的 值 。 这 样 压 人 全 局 变量 地 址 的 代码 就 是 一 个 使 用 立即 数 寻 址 的 
RATS. FEA 6-27 F, ÆA a 的 地 址 的 代码 是 

LDA a,i ;push the address of a 
符号 a 的 值 是 0003， 这 是 a 的 值 存储 的 地 方 。 这 个 指令 的 机 需 代 码 是 

C00003 
C0 是 装 和 累加 器 指令 的 指令 指示 符 ， 寻 址 -aaa 字段 为 000 表示 立即 数 寻 址 。 使 用 立即 数 寻 
址 方式 ， 操 作 数 指示 符 就 是 操作 数 ， 因 此 这 条 指令 把 0003 RA AI, MWS AEE 
压 人 运行 时 栈 。 

类 似 地 ， 压 人 b 的 地 址 的 代码 是 


LDA b,i ;push the address of b 
它 的 机 需 代 码 是 

C00005 
这 里 0005 是 b 的 地 址 。 这 条 指令 用 立即 数 寻 址 把 0005 装 人 累加 釉 ， 然 后 后 面 的 指令 把 它 
压 人 运行 时 栈 。 

在 图 6-27 中 ,在 0026， 过 程 order 调用 swap(x,y)。 它 必须 把 x 压 人 运行 时 栈 ，x 是 传 
引用 调用 ， 因 此 ， 运 行 时 栈 上 是 x 的 地 址 。 相 应 的 形 参 r 也 是 传 引 用 调用 , 因此 过 程 swap ir 
望 r 的 地 址 在 运行 时 栈 上 。 过 程 order 只 是 给 swap 传送 地 址 供 它 使 用 。0026 的 语句 

LDA x,S ;push x 


HERRAT SHEE HOSEA RMA, F—-A OCI E Be TATE. 
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然而 ， 在 过 程 order 中 ， 编 译 器 必须 翻译 

temp = r 
它 必须 把 r 的 值 装 和 人 累加 器 ， 然 后 把 它 存储 在 temp 中 。 被 调用 的 过 程 怎样 访问 地 址 在 运行 
时 栈 上 的 形 参 值 呢 ? 使 用 栈 相对 间接 寻 址 。 

记 住 ， 栈 相对 寻 址 方式 的 操作 数 和 操作 数 指示 符 之 间 的 关系 是 

Oprnd = Mem[SP + OprndSpec] 
操作 数 是 运行 时 栈 上 ， 但 是 使 用 传 引 用 调用 参数 ， 是 操作 数 的 地 址 在 运行 时 栈 上 。 栈 相对 间 
接 寻 址 方式 的 操作 数 和 操作 数 指示 符 之 间 的 关系 是 

Oprnd = Mem[Mem[SP + OprndSpec]] 
换 句 话说 ，Mem[SP + OprndSpec] 是 操作 数 的 地 址 ， 而 不 是 操作 数 本 身 。 

在 000A 和 000D 行 ， 编 译 硕 为 赋值 语句 的 翻译 生成 下 面 的 目标 代码 : 


LDA r,sf 
STA temp,s 


装 人 指令 中 的 字母 sf 表示 栈 相 对 间接 寻 址 ， 装 入 指令 的 目标 代码 是 

C40006 
这 里 的 0006 是 参数 r 的 栈 相对 地 址 ， 如 图 6-28b 所 示 ， 它 里 面 的 值 是 0003， 这 是 a 的 地 
tt, RACH a 的 值 7 装 人 累加 器 ， 存 储 指令 把 它 放 人 栈 上 的 temp 中 。 


temp 





a) HOL6 层 的 运行 时 栈 b) Asmb5s 层 的 运行 时 栈 
图 6-28 图 6-27 在 HOL6 层 和 Asmbs FAIZ TTA RE 


过 程 swap 的 下 一 条 赋值 语句 
在 赋值 运算 符 两 边 都 有 参数 。 编 译 器 生成 LDA 来 装 入 s 的 值 ， 生 成 STA 来 存储 r 的 值 ， 都 
是 使 用 的 栈 相对 寻 址 方式 。 

LDA s,sf 

STA PST 

总 之 ， 为 了 用 全 局 变量 翻译 传 引 用 调用 参数 ， 编 译 器 生成 如 下 代码 : 

e 压 人 实 参 ， 生 成 使 用 立即 数 寻 址 方式 的 装 人 指令 。 

e 访问 形 参 ， 生 成 使 用 栈 相 对 间接 寻 址 方式 的 指令 。 


6.3.6 用 局 部 变量 翻译 传 引 用 调用 参数 


图 6-29 是 一 个 计算 给 定 长 和 宽 的 矩形 周 长 的 程序 。 主 程序 通过 输入 两 个 局 部 变量 
width 和 height 给 出 长 和 宽 ，perim 是 第 三 个 局 部 变量 。 主 程序 调用 一 个 名 为 rect 的 过 
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Fe (返回 值 为 void Heke), Ue (Aa Ae width 和 height， 通 过 传 引 用 调用 传递 
277) perim。 图 中 给 出 了 当 用 户 键 人 width 为 8，height 为 5 时 的 输入 和 输出 。 


高 级 语言 


#include <iostream> 
using namespace std; 


void rect (int& p, int w, int h) { 
p= (wth) * 2; 


int main () { 
int perim, width, height; 
cout << "Enter width: "; 
cin >> width; 
cout << "Enter height: "; 
cin >> height; 
rect (perim, width, height); 
// ral 
cout << "perim = " << perim << endl; 
return 0; 

} 


汇编 语言 
0000 04000E BR main 


;*keekKK void rect (int& p. int w, int h) 
. EQUATE 6 ;formal parameter #2h 
. EQUATE 4 ;formal parameter #2d 
. EQUATE :formal parameter #2d 


C30004 LDA sp = (w+ h) * 2 
730002 ADDA 

1C ASLA 

E40006 STA 

58 endif: RETO ;pop retAddr 


’ 


s kkk kk kk main ( ) 

perim: .EQUATE ;local variable #2d 

width: . EQUATE :local variable #2d 

height: .EQUATE 0 ;local variable #2d 
680006 main: SUBSP 6,i sallocate #perim #width #height 
410046 STRO msgl,d scout << “Enter width: ” 
330002 DECI width,s ;cin >> width 
410054 STRO msg2,d scout << "Enter height: ” 
330000 DECI height,s ;Cin >> height 
02 MOVSPA ;push the address of perim 
700004 ADDA perim,i 
ESFFFE STA Ss 
C30002 LDA width,s ;push the value of width 
ESFFFC STA -4,5 
C30000 LDA height,s ;push the value of height 
E3FFFA STA -6,s | 
680006 SUBSP 6,7 ;push #p dw #h 
160003 CALL rect srect (perim, width, height) 
600006 ral: ADDSP 6,i ;pop #h jw #p 


图 6-29 ”使 用 局 部 变量 的 传 引用 调用 参数 
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0039 410063 STRO msg3,d ;cout << “perim = " 

003C 380004 DECO perim,s = << perim 

003F 50000A CHARO  '\n',i ; << end] 

0042 600006 ADDSP 6,i ;deallocate #height #width #perim 
0045 00 STOP 

0046 456E74 msgi: .ASCII "Enter width: \x00" 


0054 456E74 msg2: .ASCII “Enter height: \x00" 


0063 706572 msg3: .ASCII "perim = \x00" 


006C .END 


输入 /输出 


Enter width: 8 
Enter height: 5 
perim = 26 





图 6-29 ( 续 ) 


图 6-30 是 程序 在 HOL6 层 的 运行 时 栈 。 将 此 图 和 传 引 用 调用 全 局 变量 的 图 6-28a 进行 
比较 ， 在 那个 程序 里 ， 形 参 x、y、r 和 s 引用 全 局 变量 a 和 b, 在 Asmb5 JZ, afi b 在 翻 
译 时 用 .EQUATE 点 命令 来 分 配 ， 它 们 的 符号 就 是 它们 的 地 址 。 然 而 ， 图 6-30 显示 perim 
是 在 运行 时 栈 上 分 配 的 。000E 处 的 语句 

main: SUBSP 6,7 
给 perim 分 配 存 储 空间 ， 用 

perim: .EQUATE 4 
定义 它 的 符号 ， 该 符号 不 是 它 的 绝对 地 址 。 符 号 是 相对 于 运行 时 栈 顶 部 的 地 址 ， 如 图 6-31a 
所 示 。 符 号 的 绝对 地 址 是 FBCD ， 为 什么 呢 ? 因为 这 是 应 用 程序 运行 时 栈 的 底部 ， 如 图 4-39 
中 的 内 存 图 所 示 。 





a) 过 程 调用 之 前 b) 过 程 调 用 之 后 
图 6-30 图 6-29 在 HOL6 FANT FT AT RE 图 6-31 图 6-29 在 AsmbS5 层 的 运行 时 栈 
因此 ， 编 译 器 不 能 像 对 全 局 变量 一 样 生成 下 面 的 代码 把 参数 perim 压 人 栈 中 
LDA perim,i 
STA -2,5s 


如 果 它 生成 那样 的 指令 ， 过 程 rect 就 会 修改 Mem[0004] HAR, m 0004 并 不 是 perim 的 
位 置 。 

perim 的 绝对 地 址 是 FBCD。 图 6-31a 可 以 看 到 通过 将 栈 指针 值 加 上 perim 的 值 4， 
就 会 得 到 这 个 绝对 地 址 。 幸 运 的 是 ， 一 元 指令 MOVSPA A WERE HAA Bl Aa, 
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MOVSPA 的 RTL 描述 是 
A< SP 
ASA perim 的 地 址 ， 编 译 占 在 图 6-29 中 的 001D 生成 如 下 的 指令 : 


MOVSPA 
ADDA perim,i 
STA a 5 


BARC RIB MAA BEI AIS. BARING HRA FBC BRAHE perim 的 
值 4 加 到 累加 器 ， 得 到 FBCD。 第 三 条 指令 把 perim 的 地 址 放 到 p 的 单元 中 ， 过 程 rect 把 
周 长 存 放 在 这 里 ， 图 6-31b 显示 执行 的 结果 。 

过 程 rect 使 用 p， 就 像 所 有 的 过 程 使 用 任何 传 引 用 调用 的 参数 那样 。 也 就 是 像 在 000A 
处 ， 过 程 用 栈 相 对 间接 寻 址 来 存储 值 。 

STA p, Sf 
使 用 栈 相 对 间接 寻 址 方式 ， 操 作 数 的 地 址 在 栈 上 。 操 作 数 是 

Oprnd = Mem[Mem[SP + OprndSpec]] 

这 个 指令 把 操作 数 指 示 符 6 加 到 栈 指针 FBC1 上 ， 得 到 FBC7。 因 为 Mem[FBC7] 是 
FBCD, Pr Anas ARATE Mem[FBCD]。 

总 之 ， 为 了 用 局 部 变量 翻译 传 引 用 调用 参数 ， 编 译 器 生成 如 下 代码 : 

e 为 了 压 和 人 实 参 ， 生 成 一 元 MOVSPA 指令 ， 然 后 是 立即 数 寻 址 的 ADDA 指令 。 

e 为 了 访问 形 参 ， 生 成 使 用 栈 相 对 间接 寻 址 方式 的 指令 。 


6.3.7 ”翻译 布尔 类 型 


在 汇编 层 存 储 布尔 类 型 有 多 种 方法 。 最 适合 C++ 的 方法 是 把 值 的 true/false ( 真 / 假 ) 当 
作 整 数 常 量 。 这 两 个 值 是 


const int true = 1: 
const int false = 0; 


图 6-32 的 程序 声明 了 一 个 布尔 函数 inRange。 编 译 器 像 上 面 true Al false 声明 的 那 
样 翻译 这 个 男 数 。 


高 级 语言 
#include <iostream> 
using namespace std; 


const int LOWER = 21; 
const int UPPER = 65; 


bool inRange (int a) { 
if ((LOWER <= a) && (a <= UPPER)) { 
return true; 
} 
else { 
return false; 
} 
} 
int main () { 





图 6-32 布尔 类 型 的 翻译 


int age; 
cin >> age; 


if (inRange (age)) { 
cout << "Qualified\n"; 


} 


else { 


} 


return 0; 


} 


汇编 语言 


0000 


0003 
0006 
0009 
000C 
000F 
0012 
0015 
0018 
001B 
001C 
001F 
0022 


0023 
0026 
0029 
002C 
002F 
0032 
0035 
0038 
003B 
003E 
0041 
0044 
0047 
004A 
004B 


0056 


0063 


040023 


C00015 
B30000 
10001C 
C30000 
B00041 
10001C 
C00001 
E30002 
58 

C00000 
E30002 
58 


680002 
330000 
C30000 
E3FFFC 
680004 
160003 
600004 
Corrre 
0A0044 
41004B 
040047 
410056 
600002 
00 

517561 


556E71 


true: 

false: 
LOWER: 
UPPER: 


。 kKKKKKKK 
» 


retVal: 


a: 


inRange: 


Tt: 


then: 


else: 


kKKKKKK 


age: 
main: 


Te 


then2: 


else2: 
endif2: 


msgl: 


msg2: 


cout << “Unqualified\n"; 


BR 
. EQUATE 
. EQUATE 


. EQUATE 
. EQUATE 


bool inRange (int a) 


. EQUATE 
. EQUATE 
LDA 

CPA 
BRGT 
LDA 

CPA 
BRGT 
LDA 

STA 
RETO 
LDA 

STA 
RETO 


main () 
. EQUATE 
SUBSP 
DECI 
LDA 

STA 
SUBSP 
CALL 
ADDSP 
LDA 
BREQ 
STRO 

BR 

STRO 
ADDSP 
STOP 
ASCII 


„ASCII 


. END 


main 
1 
0 


21 
65 
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sconst int 
sconst int 


4 sreturned value #2d 

2 ;formal parameter #2d 
LOWER, i sif ((LOWER <= a) 

a,s 

else 

a,s : && (a <= UPPER)) 
UPPER, i 

else 

true,i : return true 

retVal,s 

false,i $ return false 

retVal,s 

0 ;local variable #2d 

2,1 ;allocate #age 

age,s ;Cin >> age 

age,s si x 

“4,5 ;store the value of age 
4,7 ;push #retVal #a 

inRange ; (inRange (age)) 

4,1i :pop #a #retVal 

als ;10ad retVal 

else2 sbranch if retVal == false (i.e. 0) 
msgl,d cout << "Qualified\n” 
endif2 

msg2,d cout << “Unqualified\n" 
2,41 :deallocate #age 
"Qualified\n\x00" 

"Unqualified\n\x00" 


图 6-32 (42) 
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在 位 层 上 把 false (R) M true (A) 表示 为 0000 Al 0001 (hex) 有 优势 也 有 劣势 。 考 虑 
对 布尔 量 进行 逻辑 运算 和 相应 的 汇编 指令 ANDr ORr 和 NOTr。 如 果 p 和 gq 是 全 局 布尔 变 
E, 那么 

p && q 
翻译 为 

LDA p,d 

ANDA q,d 

如 果 用 这 个 目标 代码 AND 0000 和 0001， 得 到 预期 的 0000, OR 运算 || 也 能 得 到 预期 的 结 
果 。 然 而 ，NOT 运算 会 有 问题 ， 因 为 如 果 对 0000 进行 NOT， 得 到 FFFF 而 不 是 0001， 同 样 
对 0001 进行 NOT， 得 到 的 是 FFFE 而 不 是 0000。 因 此 ， 在 翻译 C++ 赋值 语句 

p= !q 
HT, Sata ASAE RK NOT 指令， 而 是 用 异 或 运算 XOR ， 数 学 符号 为 由 。 它 有 一 个 非常 有 用 
的 属性 ， 如 果 对 任意 位 值 bp 和 0 进行 XOR， 会 得 到 b， 如 果 任 意 位 值 b 和 0 进行 XOR， 得 
到 b 的 逻辑 负 值 。 数 学 表达 式 为 

bPB0O0=b 

b@1l= ~b 

不 幸 的 是 ，Pep/8 计算 机 指令 集中 没有 XORr 指令 。 如 果 它 有 这 样 的 指令 ， 编 译 器 将 给 
上 面 的 赋值 生成 如 下 的 代码 : 


LDA q,d 
XORA 0x0001,i 
STA p,d 


如 果 q X false ( 假 )， 表 示 0000 (hex), 0000 XOR 0001 等 于 0001， 与 预期 一 样 。 同 样 ， 
如 果 q 为 true ( 真 )， 表 示 0001 (hex), 0001 XOR 0001 等 于 0000. 

直到 1996 Æ, CH 语言 标准 中 都 没有 bool 类 型 。 老 编译 器 使 用 的 规则 是 布尔 运算 符 
对 整数 进行 运算 ， 把 整数 值 0 解释 为 false( 假 )， 其 他 非 零 整数 解释 为 true ( 真 )。 为 了 保证 
向 后 兼容 ， 现 在 的 C++ 编译 器 维持 了 这 一 规则 。 


6.4 变 址 寻 址 和 数组 


HOL6 层 的 变量 在 ISA3 层 是 一 个 存储 单元 。HOL6 层 的 变量 通过 变量 名 来 引用 ， 在 
ISA3 层 是 通过 地 址 。 在 Asmb5 层 ， 通 过 符号 名 来 引用 变量 ， 而 符号 的 值 是 内 存单 元 的 
地 址 。 

数组 的 值 又 是 怎样 呢 ? 数组 包含 许多 元 素 ， 由 许多 内 存单 元 组 成 ， 这 些 内 存单 元 是 连续 
的 ， 相 互 邻 接 的 。 在 HOL6 层 ， 数 组 有 数组 名 。 在 Asmb5 层 ， 对 应 符号 的 地 址 是 数组 第 一 
个 内 存单 元 的 地 址 。 本 节 说 明 编译 器 怎样 翻译 分 配 和 访问 一 维 数组 元 素 的 源 程序 ， 翻 译 使 用 
了 多 种 变 址 寻 址 的 形式 。 

图 6-33 总 结 了 Pep/8 的 所 有 寻 址 方式 。 我 们 在 前 面 的 程序 中 说 明了 立即 、 直 接 、 栈 相 
对 和 栈 相 对 间接 寻 址 。 带 有 数组 的 程序 使 用 变 址 、 栈 变 址 和 栈 变 址 相对 寻 址 。 标 有 aaa 的 那 
一 列 展示 了 在 ISA3 层 的 寻 址 -aaa 字段 ， 标 有 字母 那 一 列 展 示 了 在 AsmbS 层 寻 址 方式 的 汇 
编 语 言 名 称 ， 标 有 操作 符 那 一 列 展示 了 CPU 根据 操作 数 指示 符 ( OprndSpec) 怎样 确定 操 
作 数 。 
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Mem [Mem [SP + OprndSpec]] 


a 
w 

z oi 
ee CT 
am TE 
me | o 

2 o 
w 

an 








直 
| 
FR 
栈 变 址 


栈 变 址 间接 


Mem [OprndSpec + X] 
Mem [SP + OprndSpec] 
Mem [Mem [SP + OprndSpec] + X] 


图 6-33 Pep/8 的 寻 址 模式 


6.4.1 翻译 全 局 数组 


除了 变量 不 是 局 部 变量 而 是 全 局 变量 之 外 ， 图 6-34 的 C++ 程序 和 图 2-15 的 程序 是 一 
样 的 。 它 给 出 了 一 个 HOL6 层 程 序 ， 声 明了 有 4 个 整数 的 全 局 数组 vector 和 一 个 全 局 整数 
j。 主 程序 用 一 个 for 循环 输入 4 个 整数 到 数组 ， 以 逆序 输出 这 4 个 整数 和 它们 的 索引 。 


高 级 语言 
#include <iostream> 
using namespace std; 


int vector[4]; 
TRE J: 


int main () { 
for tj = 0: J < 4: Jtt) 4 
cin >> vector[j]; 
} 
for (J = 3: 3 2 OF SY 1 
cout << J << = * << wector(j] << 
} 
return 0; 
} 


汇编 语言 

0000 04000D 

0003 000000 vector: ;global variable #2d4a 
000000 
0000 
0000 j: .BLOCK :global variable #2d 


， 六 交火 大 大 大大 main ( ) 
C80000 main: LDX 0,7 ;for (j = 0 
E9000B STX j.d 
B80004 forl: CPX 4,1 ; j<4 
0E0029 BRGE endForl 
1D ASLX ; an integer is two bytes 
350003 DECI vector,x ; cin >> vector[j] 
C9000B LDX j.d ; J++) 
780001 ADDX aan 





图 6-34 全 局 数组 
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E9000B STX j.d 
040013 BR forl 
C80003 endForl: LDX 3,7 sfor (j = 3 
E9000B STX j,d 
B80000 for2: CPX 0,7 ; j >= 0 
O8004E BRLT endFor2 
390008 DECO j.d : cout << j 
500020 CHARO Sat : <= 4 
1D ASLX ; an integer is two bytes 
3D0003 DECO vector,x ; << vector[j] 
50000A CHARO "An 53 : << endl 
C9000B LDX j,d Jaa 
880001 SUBX lal 
E9000B STX j.d 
04002F BR for2 
00 endFor2: STOP 
. END 


输入 
60 70 80 90 


输出 





图 6-34 ( 续 ) 


图 6-35 展示 了 整数 j 和 数组 vector 的 内 存 分 配 。 和 所 有 的 全 局 整数 一 样 ， 编 译 器 把 
HOL6 层 的 


int j; 
翻译 为 Asmb5 层 的 语句 : 
j: .BLOCK 2 


2 字 节 整数 分 配 在 地 址 000B 处 。 编 译 器 把 HOL6 层 的 


int vector[4]; 
翻译 为 Asmb5 层 的 语句 : 

vector: .BLOCK 8 

由 于 数组 有 4 个 整数 ， 所 以 分 配 8 字 节 ， 每 个 整数 2 字 节 。.BLOCK 语句 的 地 址 是 
0003。 从 图 6-35 可 以 看 到 0003 是 数组 第 一 个 元 素 的 地 址 ， 第 二 个 元 素 的 地 址 是 0005， 每 
个 元 素 的 地 址 比 前 一 个 元 素 的 地 址 大 2 字 节 。 

编译 器 照常 翻译 第 一 个 for 语句 

for ig = 0; J < 4; ge) 
由 于 j 是 全 局 变量 ， 所 以 用 直接 寻 址 访问 j。 但 是 怎样 访问 vector[j] 呢 ? 不 能 只 是 使 用 
直接 寻 址 ， 因 为 符号 vector 的 值 是 数组 第 一 个 元 素 的 地 址 。 如 果 j 的 值 是 2， 它 应 该 访问 
数组 的 第 三 个 元 素 ， 而 不 是 第 一 个 。 

答案 是 使 用 变 址 寻 址 。 使 用 变 址 寻 址 时 ，CPU 计算 操作 数 为 
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Oprnd = Mem[OprndSpec + X] 
它 将 操作 数 指示 符 和 变 址 寄存 咒 相 加 ， 把 和 作为 主 内 存 地 址 ， 然 后 从 这 个 地 址 获取 操 
在 图 6-34 中 ,编译 胡 将 HOL6 层 的 


cin >> vector[j]; 


翻译 为 Asmb5 层 的 

ASLX 

DECI vector,x 

EMM aR. Sa PERE OP PT a AE CES, WEED aA SALE j 
的 值 。 非 优化 编译 需 会 生成 下 面 的 代码 


LDX jd 
ASLX 
DECI vector,x 


假定 j 的 值 为 2，LDX 将 j ABA EE ay ea (或 者 ， 优 化 编译 器 确定 现在 的 j 值 已 
经 在 变 址 寄存 器 里 )。ASLX 将 2 乘 以 2， 把 4 放 入 变 址 寄存 器 。DECI 使 用 变 址 寻 址 。 因 此 ， 
这 样 计算 操作 数 

Mem[OprndSpec + x] 

Mem[0003 + 4] 

Mem[0007] 

它 是 图 6-35 中 的 vector[2]。 如 果 数 组 是 字符 数组 ， 那 么 ASLX 运算 就 不 必要 了 ， 因 
为 每 个 字符 仅 占 1 字 节 。 一 般 来 说 ， 如 果 数 组 的 每 个 单元 占用 nn 字 节 ， 那 么 j 的 值 乘 以 n 装 
入 变 址 寄存 亏 ， 用 变 址 寻 址 访问 数组 元 素 。 

类 似 地 ， 编 译 项 用 变 址 寻 址 方式 将 vector[j] 的 输出 翻译 为 


ASLX 
DECO vector,x 


总 之 ,为 了 翻译 全 局 数组 ， 编 译 器 遵循 如 下 规则 生成 代码 : 
e 用 .BLOCK tot 给 数组 分 配 存 储 空 间 ，tot 是 数组 占用 的 总 字 节 数 。 

e 通过 把 索引 乘 以 每 个 单元 的 字 节 数 装 入 变 址 寄存 器 来 访问 数组 元 素 ， 使 用 变 址 寻 址 。 
格式 跟踪 标签 说 明 数 组 有 多 少 个 单元 以 及 多 少 字 节 。 在 


0003 vector[0] 
图 6-34 中 的 0003, vector 的 声明 为 0005 vector[1] 
vector: .BLOCK 8 ;global variable #2d4a 0007 vector[2] 
应 该 把 格式 跟踪 标签 #2d4a 读 作 “两 字 节 十 进 制 ，4 单 0009 We 
元 数组 ”。 使 用 这 种 说 明 ，Pep/8 调试 器 将 生成 类 似 于 图 6-35 me J 
那样 的 每 个 单元 都 有 标记 的 数组 示意 图 。 图 6-35 图 6-34 所 示 全 局 数据 的 
内 存 分 配 


6.4.2 翻译 局 部 数组 


就 像 所 有 的 局 部 变量 一 样 ， 局 部 数组 在 程序 执行 期 间 在 运行 时 栈 上 进行 分 配 。SUBSP 指 
令 给 数组 分 配 空间 ，ADDSP 指令 释放 空间 。 除 了 索引 j 和 数组 vector 是 main() 的 局 部 变 
量 外 ， 图 6-36 的 程序 和 图 6-34 的 程序 是 一 样 的 。 

图 6-37 展示 了 图 6-36 中 的 程序 在 运行 时 栈 上 的 内 存 分 配 。 编 译 器 把 HOL6 层 的 
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高 级 语言 
#include <iostream> 
using namespace std; 


int main () { 
int vector[4]; 
int j; 
for Cj = 03 J < 4; JFF) I 
cin >> vector[j]; 
} 
for Gi = 33 J >= OF J=) { 
cout << j << ' ' << vector[j] << endl; 
} 
return 0; 


汇编 语言 
0000 040003 BR 


。 大 太太 炎 大 火炎 main ( ) 


vector: .EQUATE 

Je . EQUATE 
68000A main: SUBSP 10,7 
C80000 LDX 0,i 
EB0000 STX 145 


:local variable #2d4a 
;local variable #2d 
;allocate #vector #j 
;for (j = 0 


B80004 
0E0022 
1D 

360002 


` CB0000 


780001 
EB0000 
04000C 


C80003 endForl: 


EB0000 


B80000 for2 : 


080047 
3B0000 
500020 
1D 

3E0002 
50000A 
CB0000 
880001 
EB0000 
040028 


60000A endFor2: 


00 


ADDSP 
STOP 


. END 


4,i 
endForl 


vector,sx 
Jas 

1,3 

j.s 
forl 
3,7 

Jes 

0,7 
endFor2 
448 

2 v4 


vector,sx 
'\n',i 
4.5 

1,1 

Jys 

for2 

10,7 


j< 4 


an integer is two bytes 
cin >> vector[j] 


j++) 


“Tor (J = 3 


j >= 0 


cout << j 
a 


an integer is two bytes 
<< vector[j] 


<< end] 
jes] 


;deallocate #j #vector 





图 6-36 局 部 数组 。 这 个 C++ 程序 来 自 于 图 2-15 


int vector[4]; 


int J: 


翻译 成 Asmb5 层 的 


main: 


SUBSP 10,1 
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给 vector 分 配 8 字 节 ,给 j 分 配 2 字 节 ， 总 共 10 字 市 。 用 
vector: .EQUATE 2 
j: . EQUATE ,0 


设置 符号 的 值 ， 这 里 2 是 vector 第 一 个 单元 的 栈 相 对 地 址 ，0 是 j 的 栈 相 对 地 址 ， 如 图 6-37 
所 示 。 
编译 器 是 怎样 访问 vector[j] 的 呢 ? 不 能 使 用 变 址 寻 址 ， 因 为 符号 vector 的 值 不 是 
数组 第 一 个 元 素 的 地 址 。 需 要 使 用 栈 变 址 寻 址 。 使 用 栈 变 址 寻 址 ，CPU 这 样 计 算 操 作 数 
Oprnd = Mem[SP + OprndSpec + X] 


将 栈 指针 、 操 作 数 指示 符 和 变 址 寄存 器 相 加 ， 把 这 个 ORO 
和 作为 它 从 主 内 存 获取 操作 数 的 地 址 。 4 eee SE 
在 图 6-37 P, arkar HOL6 层 的 6 FBCB vector[2] 
cin >> vector[j]; 8 FBCD vector[3] 
翻译 成 Asmb5 层 的 “ 
ay 图 6-37 图 6-36 中 局 部 数组 的 内 存 分 配 


DECI vector,sx 


和 前 面 的 程序 一 样 ， 这 是 一 个 优化 的 翻译 。 非 优化 编译 器 将 会 生成 下 面 的 代码 : 
LDX Jj 对 
ASLX 
DECI vector,sx 


假定 j 的 值 为 2，LDX 把 j 的 值 放 人 变 址 寄存 器 。ASLX 把 2 乘 以 2， 变 址 寄存 带 中 的 内 
容 变 为 4。DECI 使 用 栈 变 址 寻 址 。 这 样 ， 像 下 面 这 样 计算 操作 数 

Mem[SP + OprndSpec + X] 

Mem[FBCS + 2 + 4] 

Mem[FBCB] 

它 是 图 6-37 中 的 vector[2]。 我 们 可 以 看 到 栈 变 址 寻 址 是 如 何 设 计 来 为 运行 时 栈 上 
的 数组 服务 的 。SP 是 栈 顶 地 址 ，OprndSpec 是 数组 第 一 个 单元 的 栈 相 对 地 址 ， 因 此 SP + 
OprndSpec 就 是 数组 第 一 个 单元 的 绝对 地 址 。 变 址 寄存 器 里 存放 的 是 j ( 乘 以 数组 每 个 单元 
的 字 节 数 )， 因 此 SP + OprndSpec + X 的 和 是 数组 单元 j 的 地 址 。 

总 之 ， 为 了 翻译 局 部 数组 ， 编 译 顺 遵照 如 下 原则 生成 代码 : 

e 用 SUBSP 对 数组 进行 分 配 ， 用 ADDSP 释放 。 

e 通过 把 索引 装 人 变 址 寄存 器 来 访问 数组 元 素 ， 把 索引 乘 以 每 个 单元 的 字 闻 数 ， 使 用 

栈 变 址 寻 址 。 


6.4.3 翻译 作为 参数 传递 的 数组 


在 C++ 中 ， 数 组 名 是 数组 第 一 个 元 素 的 地 址 。 当 要 传递 一 个 数组 时 ， 即 使 在 形 参 表 中 
不 用 & 指明 ， 也 是 传递 的 数组 第 一 个 元 素 的 地 址 。 这 个 效果 就 与 传 引 用 调用 数组 一 样 。C 语 
言 的 设计 者 认为 程序 员 几 乎 从 来 不 会 想 去 传 值 调 用 一 个 数组 ， 因 为 这 样 的 调用 效率 太 低 。 由 
于 栈 必须 包含 整个 数组 ， 所 以 要 求 运 行 时 栈 必须 有 大 量 的 存储 空间 。 还 会 需要 大 量 的 时 间 ， 
因为 每 个 单元 的 值 要 复制 到 栈 中 。 因 此 ，C++ 中 对 数组 默认 的 是 传 引用 调用 。 

图 6-38 展示 了 编译 需 怎 样 翻译 一 个 把 局 部 数组 作为 参数 传递 的 程序 。 主 程序 传递 整数 
数组 vector 和 整数 numItms 到 程序 getVect All putVect, getVect 把 值 输入 到 数组 并 
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把 numItms 设置 为 输入 条 目的 数量 值 ，putVect 输出 数组 的 值 。 


高 级 语言 
#include <iostream> 
using namespace std; 


void getVect (int v[], int& n) { 
int jo 
Cin >> fig 
ror U = OF 9 < me ott) 4 
cin >> v[j]; 


void putVect (int v[], int n) { 
int j: 
for (j= 0; j < n; j++) { 
cout << VLIJT << T t 
} 
cout << endl; 


int main () { 
int vector[8]; 
int numItms; 
getVect (vector, numItms); 
putVect (vector, numItms); 
return 0; 

} 


汇编 语言 
0000 04004C BR 


getYyect (1 v[], int& n) 
V: . EQUATE :formal parameter #2h 
ñi EQUATE ;formal parameter #2h 
j: . EQUATE ;local variable #2d 

680002 getVect: SUBSP ;allocate #j 

340004 DECI “cin >> n 

C80000 LDX 3 ;for (J = 0 

EB0000 STX 

BC0004 forl: CPX ; J «nh 

0E0025 BRGE endForl 

1D ASLX > an integer is two bytes 

370006 DECI V,SXxXf ; cin >> VLJ] 

CB0000 LDX Fas ; j++) 

780001 ADDX 1.3 

EB0000 STX Tos 

04000F BR fori 

5A endForl: RET2 ;pop #j and retAddr 
“srs putVect: (int vid. int n) 
v2: . EQUATE ;formal parameter #2h 
n2: . EQUATE ;formal parameter #2d 
j2: . EQUATE ;local variable #2d 





图 6-38 将 局 部 数组 作为 参数 传递 


680002 putVect: SUBSP 


C80000 
EB0000 
BB0004 
0E0048 
10 

3F0006 
500020 
CB0000 
780001 
EB0000 
04002F 
50000A 
5A 


680012 
02 


endFor2: 


. 
» 


e kkk KKK 


vector: 
numItms: 
main: 


LDX 
STX 
CPX 
BRGE 
ASLX 
DECO 
CHARO 
LOX 
ADDX 
STX 
BR 
CHARO 
RET2 


main () 
. EQUATE 
. EQUATE 
SUBSP 

MOVSPA 


endFor2 


v2,Sxf 
ee 
1245 
Let 
+2, 5 
fore 
Aa l 


2 
0 
18,i 


BOF RFZLAZ 


;allocate #j2 
sfor (j = 0 


1< 7 


an integer is two bytes 
cout << v[j] 

<< * * 
i++) 


scout << endl 
;pop #j2 and retAddr 


;local variable #2d8a 
;local variable #2d 
;allocate #vector #numItms 
;push address of vector 


700002 ADDA 
ESFFFE STA 

02 MOVSPA 
700000 ADDA numItms,i 
ESFFFC STA -4,S 
680004 SUBSP 4,1 
160003 CALL getVect 
600004 ADDSP 4,7 

02 MOVSPA 
700002 ADDA 
E3FFFE 9TA 
C30000 LDA 
E3FFFC STA 
680004 
160026 


vector,i 
ae 
;push address of numItms 


:push #v #n 
;getVect (vector, numItms) 
;pop #n #v 
;push address of vector 
vector,i 
“2,5 
numItms,s 
-4,s 
SUBSP 4,7 
CALL putVect 
600004 ADDSP 4,71 
600012 ADDSP 18; 1 
00 STOP 

. END 


;push value of numItms 


;push #v2 #n2 

;putVect (vector, numItms) 
;pop #n2 #v2 

;deallocate #numItms #vector 


50 60 70 80 


60 70 80 
图 6-38 ( 续 ) 
如 图 6-38 所 示 ， 编 译 融 将 局 部 变量 


int vector[8]; 
int numItms ， 


翻译 成 
vector: .EQUATE 2 


numItms: .EQUATE 0 
main: SUBSP 18,i 
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SUBSP 指令 在 运行 时 栈 上 分 配 18 字 节 ，16 字 节 用 于 数组 的 8 个 整数 ，2 字 节 用 于 整数 。 
点 命令 .EQUATE 把 符号 设置 成 它们 对 应 的 栈 偏 移 量 ， 如 图 6-39a 所 示 。 





2 FBB7 retAddr 
-4 FBB9 n 4 FBB9 n 
-2 FBBB V 6 FBBB V 
SPe—» 0 FBBD numItms FBBD| | numItms 
2 FBBF vector[0] FBBF vector[0] 
4 FBC] vector[1] FBC] vector[1] 
6 FBC3 vector[2] FBC3 vector[2] 
8 FBCS5 vector[3] FBC5 vector[3] 
10 FBC7 vector[4] FBC7 vector[4] 
12 FBC9 vector[5] FBC9 vector[5] 
14 FBCB vector[6] FBCB vector[6] 
16 FBCD vector[7] FBCD vector[7] 
7 
a) 调用 getVect 之 前 b) 调用 getVect 之 后 


图 6-39 图 6-38 所 示 程 序 的 运行 时 栈 
编译 需要 翻译 


getVect (vector, numItms); 


首先 生成 把 vector 的 第 一 个 单元 的 地 址 压 入 的 代码 


MOVSPA 
ADDA vector,i 
STA -2.S 
接着 生成 压 人 numItms 地 址 的 代码 
MOVSPA 
ADDA numltms ,i 
STA =S 
RIE PRIR 


void getVect (int v[], int& n) 


的 参数 v[] 没 有 用 &， 但 是 编译 器 会 生成 代码 ， 用 MovSPA 和 ADDA 指令 压 人 v 的 地 址 。 
参数 n 使 用 了 &， 编 译 器 会 用 同样 的 方式 生成 压 人 mn 的 地 址 的 代码 。 图 6-39b 说 明 v 等 于 
FBBF， 即 vector[0] 的 地 址 ; n 是 FBBD， 即 numItms 的 地 址 。 

图 6-39b 也 展示 了 getVect 中 参数 和 局 部 变量 的 栈 偏 移 量 。 编 译 器 相应 地 定义 符号 : 


v: .EQUATE 6 
n: .EQUATE 4 
j: .EQUATE 0 


把 输入 语句 
cin >> ns 
翻译 为 
DECI Wi ST 


这 里 使 用 栈 相 对 间接 寻 址 ， 因 为 n 是 传 引 用 调用 的 ，n 的 地 址 在 栈 上 。 
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但 是 编译 需 怎 样 翻译 


cin >> viji: 


We? 不 能 使 用 栈 变 址 寻 址 方式 ， 因 为 该 数组 的 值 不 在 getVect 的 栈 帧 中 。v 的 值 为 6， 这 表 
示 数 组 第 一 个 单元 的 地 址 在 栈 顶 下 面 6 字 节 的 位 置 。 该 数组 的 值 在 main() 的 栈 帧 中 。 栈 变 
址 间接 寻 址 就 是 设计 用 来 访问 这 样 的 数组 元 素 ， 数 组 的 地 址 在 顶部 的 栈 帧 中 ， 但 是 实际 的 值 
并 不 在 。CPU 用 栈 变 址 相对 寻 址 来 这 样 计算 操作 数 : 

Oprnd = Mem[Mem[SP + OprndSpec] + X] 
栈 指 针 和 操作 数 指示 符 相 加 ， 把 这 个 和 作为 数组 第 一 个 元 素 的 地 址 ， 再 把 这 个 地 址 和 变 址 寄 
存 器 相 加 。 编 译 需 把 输入 语句 翻译 成 


ASLX 
DECI v,sxf 


这 里 sxf 表示 是 栈 变 址 间接 寻 址 ， 编 译 器 已 经 确定 变 址 寄存 器 里 包含 j 的 当前 值 。 

例如 ， 假 定 j 的 值 是 2，ASLX 指令 把 它 乘 以 2 得 到 4， 操 作 数 的 计算 如 下 

Mem[Mem[SP + OprndSpec] + X] 

Mem[Mem[FBB5 + 6] + 4] 

Mem[Mem[FBBB] + 4] 

Mem[FBBF + 4] 

Mem[FBC3] 

它 是 vector[2]， 和 图 6-39b 预期 的 一 样 。 

在 图 6-39 中 过 程 getVect 和 putVect 形 参 的 名 字 是 一 样 的 。 在 HOL6 JE, BRAM 
范围 ， 限 制 在 函数 体内 。 程 序 员 知 道 在 getVect 体 中 包含 n 的 语句 引用 的 是 getVect 参数 
列表 中 的 n， 而 不 是 putVect 参数 列表 中 的 no Am, Æ Asmb5 层 ， 符 号 名 的 范围 却 是 整 
个 汇编 语言 程序 。 编 译 器 不 能 给 putVect 中 的 nm 使 用 与 getyect 中 一 样 的 符号 ， 因 为 
重复 的 符号 定义 会 引起 歧义 。 所 有 的 编译 器 在 将 HOL6 层 的 名 字 声 明 翻 译 到 Asmb5 层 的 符 
号 时 ， 必 须 有 某 种 用 来 管理 这 些 名 字 声 明 范 围 的 机 制 。 图 6-38 中 的 编译 希 通 过 给 符号 名 附 
加 数字 2 形成 无 二 义 性 的 标识 符 。 因 此 编译 需 将 HOL6 层 的 putVect 中 的 变量 名 n 翻译 成 
Asmb5 层 的 符号 n2， 对 v 和 j 做 同样 的 处 理 。 

在 过 程 putVect 中 ， 数 组 作为 参数 传递 , 但 n 是 传 值 调 用 。 在 准备 过 程 调用 时 ， 和 前 
面 一 样 ， 将 vector 的 地 址 压 人 栈 ， 但 这 次 是 将 numItms 的 值 压 人 栈 。 在 过 程 putyvect 
中 ， 使 用 栈 相对 寻 址 来 访问 n2 

下 
只 是 因为 n2 是 传 值 调用 。 使 用 栈 变 址 间接 寻 址 来 访问 v2 


ASLX 
DECO v2,sxf 


就 像 它 在 getVect 中 一 样 。 

在 图 6-38 中 ，vector 是 局 部 数组 。 如 果 它 是 全 局 数组 ， 那 么 对 getVect All putVect 的 
翻译 不 会 改变 。 使 用 栈 变 址 间接 寻 址 来 访问 v[j] ， 它 预期 数组 的 第 一 个 元 系 的 地 址 在 顶部 
的 栈 帧 中 。 唯 一 的 不 同 的 是 在 准备 调用 时 压 人 数组 第 一 个 元 素 地 址 的 代码 ， 与 图 6-34 中 的 
程序 一 样 ， 全 局 数组 的 符号 值 是 数组 第 一 个 单元 的 地 址 。 因 此 要 压 人 数组 第 一 个 单元 的 地 
址 ， 编 译 器 会 生成 一 条 使 用 立即 数 寻 址 的 LDA 指令 ， 后 面 跟 一 个 栈 相 对 寻 址 的 STA 指令 来 
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ITEA 

总 之 ， 为 了 把 数组 作为 参数 传递 ， 编 译 器 遵循 如 下 原则 生成 代码 : 

e 将 数组 的 第 一 个 元 素 的 地 址 压 人 运行 时 栈 ， 或 者 (a) 对 于 局 部 数组 ， 用 MOVSPA， 后 
面 跟 采 用 立即 数 寻 址 的 ADDA; 或 者 (b) 对 于 全 局 数组 ， 使 用 立即 数 寻 址 的 LDA。 

e 通过 把 索引 装 入 变 址 寄存 器 来 访问 数组 元 素 ， 将 索引 乘 以 每 个 单元 的 字 节 数 ， 使 用 
栈 变 址 间接 寻 址 。 


6.4.4 翻译 switch 语句 


图 6-40 中 的 程序 就 是 图 2-12 中 的 程序 ， 它 展示 了 编译 器 怎样 翻译 C++ 的 switch 语 
句 。 这 个 程序 使 用 了 一 个 有 趣 的 变 址 寻 址 和 无 条 件 转移 BR 的 结合 。switch HARREN 
if 语句 是 不 一 样 的 。 如 果 用 户 给 guess 输入 2，switch 语句 不 会 将 guess 与 0 和 1 比较 ， 
而 是 直接 转移 到 第 三 个 选择 。 由 于 索引 机 制 允许 程序 员 不 用 遍历 所 有 前 面 的 元 素 而 随机 访问 
任意 元 素 ， 所 以 数组 是 一 个 随机 访问 的 数据 结构 。 例 如 ， 要 访问 一 个 整数 矢量 的 第 三 个 元 
素 ， 可 以 直接 写 vector[2] 而 不 用 先 遍 历 vector[0] 和 vector[1]。 主 存 实际 上 是 1 字 
节 数 组 ， 字 节 的 地 址 就 对 应 于 这 个 数组 的 索引 。 为 了 翻译 switch 语句 ， 编 译 器 分 配 一 个 叫 
作 转 移 表 (jump table) 的 地 址 数组 。 转 移 表 中 的 每 个 条 目 是 一 段 代 码 第 一 条 语句 的 地 址 ， 每 
段 代 码 对 应 switch 语句 的 一 种 情况 。 使 用 变 址 寻 址 ， 程 序 能 够 直接 转 到 情况 2 (case 2 ) 。 


高 级 语言 


#include <iostream> 
using namespace std; 


int main () { 
int guess; 
cout << “Pick a number 0..3: " 
cin >> guess; 
switch (guess) { 
case 0: cout << “Not close"; break; 
case 1: cout << "Close"; break; 
case 2: cout << "Right on"; break; 
case 3: cout << "Too high"; 
} 
cout << endl; 
return 0; 
} 


汇编 语言 
0000 040003 BR 


pene mai n ( ) 
guess: . EQUATE 0 ;1ocal variable #2d 
680002 main: SUBSP 2,i ;allocate local #guess 
STRO msgin,d scout << "Pick a number 0.,.3: " 
DECI guess,s :Cin >> Guess 
LDX guess,s ;Switch (Guess) 
ASLX :addresses occupy two bytes 
050013 BR guessJT,x 





图 6-40 switch 语句 的 翻译 。 这 个 C++ 程序 来 自 图 2-12 


001B guessJT: 
0021 

0027 

002D 

41004C case0: 
040030 

410056 casel: 
040030 

41005C case2: 
040030 

410065 case3: 
50000A: endCase: 
600002 

00 

506963 msgIn: 


4E6F74 msg0: 
436C6F msgl: 


526967 msg2: 


546F6F msg3: 


.ADDRSS case2 


在 0017 处 生成 的 目标 代码 是 0027。 


.ADDRSS 
.ADDRSS 
.ADDRSS 
.ADDRSS 
STRO 

BR 

STRO 

BR 

STRO 

BR 

STRO 
CHARO 
ADDSP 
STOP 
.ASCT] 


„ASCII 


„ASCII 


-ASCII 


SC 


.END 


case0 
casel 
case? 
case3 
msg0,d 
endCase 
msgl,d 
endCase 
msg2,d 
endCase 
msg3,d 
hs al 
Ea] 


BOR? REIL RE 


¿cout << "Not close“ 
:break 

scout << "Close" 
;break 

-cout << "Right on" 
;break 

scout << "Too high" 
¿count << end] 
:deallocate #guess 


"Pick a number 0..3: \x00" 


“Not close\x00" 


"Close\x00" 


"Right on\x00" 


“Too high\x00" 





图 6-40 (2£) 


6-40 展示 了 汇编 语言 程序 中 在 0013 处 的 转移 表 。 在 0013 生成 的 代码 是 001B ， 这 是 
情况 (case 0 ) 第 一 条 语句 的 地 址 ， 在 0015 生成 的 代码 是 0021， 这 是 情况 1 (case 1 ) 第 一 
条 语句 的 地 址 ， 以 此 类 推 。 编 译 器 用 .ADDRSS 伪 操 作 生 成 转移 表 ， 每 个 .ADDRSS 命令 后 面 
必须 跟 一 个 符号 ，.ADDRSS 生成 的 代码 是 符号 的 值 。 例 如 ，case2 是 一 个 符号 ， 它 的 值 是 
0027， 这 是 如 果 guess 的 值 为 2 时 要 执行 代码 的 地 址 。 因 此 ， 


假定 用 户 为 guess 的 值 输入 2， 语 句 


LDX guess,s 
把 2 AED A Eat, TAA] 
ASLX 


将 2 FLA 2, AFAR PA 4, Aa 


BR guessJT,x 


199 


是 变 址 寻 址 的 无 条 件 转移 。 操 作 数 指示 符 guessJT 的 值 是 0013 ， 这 是 转移 表 第 一 个 字 的 地 
址 。 对 于 变 址 寻 址 ，CPU 这 样 计算 操作 数 


Oprnd = Mem[OprndSpec + X] 
因此 CPU 计算 

Mem[OprndSpec + X] 

Mem[0013 + 4] 


200 BORD LRA (FSA) 


Mem[0017 | 

0027 
将 0027 作为 操作 数 。BR 指令 的 RTL 描述 是 

PC < Oprnd 

因此 CPU 把 0027 放 在 程序 计数 器 。 因 为 汉 “' 诺 依 曼 周期 ， 所 以 下 一 条 要 执行 的 指令 是 
在 地 址 0027 处 的 指令 ， 这 正好 是 情况 2 (case 2 ) 的 第 一 条 指令 。 

C++ 中 的 break 语句 被 翻译 成 一 条 BR 指令 ， 转 移 到 switch 语句 的 末尾 。 如 果 在 C++ 
程序 中 省 略 了 break， 那 么 编译 器 也 会 省 略 这 个 BR， 控 制 将 转移 到 下 一 个 情况 (case) 中 。 

如 果 用 户 键 和 人 一 个 不 在 0 一 3 范围 内 的 数 ， 那 么 就 会 发 生 运行 时 错误 。 例 如 ， 如 有 果 用 户 
给 guess 键入 4，ASLX 指令 将 它 乘 以 2， 那么 变 址 寄存 句 中 为 8 ，CPU 这 样 计算 操作 数 

Mem[OprndSpec + X] 

Mem[0013 + 8] 

Mem[001B] 

4100 
因此 将 转移 到 内 存单 元 4100 Chex) 处 。 问 题 在 于 汇编 程序 给 STRO 指令 生成 001B ， 这 个 
001B 不 是 作为 转移 地 址 来 解释 的 。 为 了 防止 用 户 发 生 这 样 的 事情 ，C++ 指定 如 果 guess 的 
值 不 是 情况 之 一 ， 那 就 任何 事情 都 不 做 。 它 也 给 switch 语句 提供 了 一 种 default 情况 ， 
用 来 处 理 前 面 没有 出 现 过 的 情况 。 编 译 器 一 定 要 给 guess 生成 一 个 初始 的 条 件 转移 ， 用 来 
处 理 其 他 情况 没有 覆盖 到 的 值 。 本 章 结尾 的 问题 会 讨论 switch 语句 的 这 个 特性 。 


6.5 动态 内 存 分 配 


编译 器 的 目的 是 为 程序 员 创造 一 种 高 层次 的 抽象 。 例 如 ， 它 让 程序 员 思 考 单个 while 
循环 ， 而 不 是 思考 在 机 器 上 执行 循环 所 必需 的 汇编 层 具体 的 有 条 件 转移 。 隐 藏 较 低 层次 的 细 
节 是 抽象 的 本 质 。 

但 程序 控制 的 抽象 仅仅 是 问题 的 一 面 ， 另 一 面 是 数据 的 抽象 。 在 汇编 层 和 机 器 层 ， 唯 
一 的 数据 类 型 是 位 和 字 节 。 前 面 的 程序 展示 了 编译 器 怎样 翻译 字符 、 整 数 和 数组 这 些 数 据 类 
型 ， 这 些 类 型 中 的 每 一 种 都 可 以 是 全 局 的 ， 使 用 .BLOCK 分 配 ; 或 者 是 局 部 的 ， 用 SUBSP 
在 运行 时 栈 上 分 配 。 但 是 C++ 程序 还 能 包含 结构 和 指针 ， 这 是 许多 数据 结构 的 基本 构件 。 
在 HOL6 JZ, 指针 访 问 用 new 操作 符 在 堆 上 分 配 的 结构 。 本 节 展 示 一 个 Asmb5 层 上 简单 的 
堆 操作 ， 以 及 编译 器 怎样 翻译 包含 指针 和 结构 的 程序 。 


6.5.1 翻译 全 局 指针 


图 6-41 展示 了 一 个 有 全 局 指针 的 C++ 程序 ， 以 及 它 到 Pep/8 汇编 语言 的 翻译 。 这 个 
C++ 程序 和 图 2-37 中 的 程序 是 一 样 的 。 图 2-38 展示 了 当 程 序 执行 时 堆 的 分 配 。 堆 是 不 同 于 
栈 的 内 存 区 域 。 编 译 器 ， 与 操作 系统 合作 ， 必 须 生 成 执行 堆 分 配 和 释放 的 代码 。 


高 级 语言 
#include <iostream> 


using namespace std; 





int *a, *b, *c; 


图 6-41 全 局 指针 的 翻译 。 这 个 C++ 程序 来 自 图 2-37 
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int main () { 
a = new int; 
xA =: 5 
b = new int; — 
xD = 3; 
c- a; 
a = b; 
kA m oF keo 
cout << “*a =" << *a << 
cout << "p = * XK wD << 
COUT SS TNE = * << ™e KK 
return 0; 


BR 
a: . BLOCK ;global variable #2h 
b: .BLOCK ;global variable #2h 
C: .BLOCK :global variable #2h 
i main ( ) 
C00002 main: LDA i ;a = new int 
16006A CALL ;#a 
E90003 STX 
C00005 LDA s*a = 5 
E20003 STA 
C00002 LDA ;b = new int 
16006A CALL ;#b 
E90005 STX b,d 
C00003 LDA S61 
E20005 STA b,n 
C10003 LDA a.d 
E10007 STA c,d 
C10005 LDA b,d 
E10003 STA a,d 
C00002 LDA ex ee a gt XE 
720007 ADDA Cc,n 
E20003 STA a,n 
410058 STRO msg0,d scout << "*a =" 
3A0003 DECO a,n ; << *a 
50000A CHARO  '\n’',i ; << end] 
41005E STRO msgl,d scout << “*b = " 
3A0005 DECO b,n >; << *b 
50000A CHARO  '\n’,i ; << end] 
410064 STRO msg2 ,d scout << "WC = ™ 
3A0007 DECO C5 5 ie ee 
50000A CHARO  '\n',i : << end] 
00 STOP 
2A6120 msg0: .ASCII "“*a = \x00" 
302000 
2A6220 msgl: .ASCII “*b = \x00" 
302000 
2A6320 msg2: «ASCIT “wo = \x00" 
3D2000 





图 6-41 (2) 


301 
302 


202 BORD LRA (FSA) 


TRE QONerator New 
Precondition: A contains number of bytes 
: Postcondition: X contains pointer to bytes 
C90074 new: LDX hpPtr,d ;returned pointer 
ADDA hpPtr,d ;allocate from heap 
STA hpPtr,d ;update hpPtr 
RETO 


0076 hpPtr: .ADDRS9 heap ;address of next free byte 
00 heap: .BLOCK 1 ;first byte in the heap 
. END 





图 6-41 ( 续 ) 


当 在 C++ 中 用 指针 编程 时 ， 要 用 new 操作 符 在 堆 上 分 配 存储 空间 。 当 程序 不 再 需要 这 
些 存 储 空间 时 ， 用 delete 操作 符 释 放 它 们 。 有 可 能 在 堆 上 分 配 多 个 内 存单 元 ， 上 再 从 中 间 释 
放 一 个 单元 。 内 存 管理 算法 必须 能 够 处 理 这 种 情形 。 本 书 只 是 入 门 级 介绍 ， 为 了 描述 简单 ， 
这 里 使 用 的 说 明 堆 的 程序 不 显示 释放 过 程 。 堆 位 于 主 存 中 应 用 程序 的 末尾 。 操 作 符 new 在 
堆 上 分 配 存储 空间 ， 因 此 堆 是 向 下 生长 的 。 一 旦 内 存 被 分 配 了 ， 就 不 会 被 释放 。Pep/8 的 这 
个 属性 是 不 切实 际 的 ， 但 是 比 描述 实际 情况 更 易于 理解 。 

图 6-41 中 的 汇编 语言 程序 展示 了 堆 从 0076 开始 ， 这 是 符号 heap 的 值 。 分 配 算法 维护 
一 个 叫 作 hpPtr 的 全 局 指针 ， 它 代表 堆 指 针 。 在 0074 的 语句 


hpPtr: .ADDRSS heap 


将 hpPtr 初始 化 为 堆 中 第 一 个 字 节 的 地 址 。 应 用 程序 向 new 操作 符 提 供需 要 的 字 节 数 ，new 
操作 符 返 回 hpPtr 的 值 ， 然 后 把 hpPtr 加 上 请 求 的 字 节 数 。 因 此 new 操作 符 保证 hpPtr 
总 是 指向 在 堆 中 下 一 个 可 以 被 分 配 字 节 的 地 址 。 

操作 符 new 的 调用 协议 不 同 于 函数 的 调用 协议 。 对 于 函数 ， 信 息 通过 运行 时 栈 上 的 参 
数 进 行 传递 ; 而 对 于 new 操作 符 ， 应 用 程序 把 要 分 配 的 字 节 数 放 入 累加 器 ， 再 执行 CALL 语 
句 去 调用 new 操作 符 。new 操作 符 为 应 用 程序 把 当前 的 hpPtr 值 放 人 变 址 寄存 占 ， 因 此 成 
功 执行 new 操作 的 前 提 条 件 是 累加 器 中 包含 要 在 堆 上 分 配 的 字 节 数 ， 后 置 条 件 是 变 址 寄存 
器 包含 new 操作 要 在 堆 上 分 配 的 第 一 个 字 节 的 地 址 。 

new 操作 符 的 调用 协议 比 函 数 的 调用 协议 更 高 效 。new 的 实现 只 要 4 行 汇 编 语 言 代 码 ， 
包括 RETO 语句 。006A 的 语句 


new: LDX hpPtr,d 


把 堆 指 针 的 当前 值 放 入 变 址 寄存 器 。006D 的 语句 


ADDA hpPtr,d 


给 堆 指针 加 上 要 分 配 的 字 节 数 。0070 的 语句 


STA hpPtr,d 


把 hpPtr 更 新 为 堆 上 第 一 个 未 分 配 字 节 的 地 址 。 
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这 个 协议 高 效 有 两 个 原因 。 首 先 ， 它 没有 像 函 数 那样 很 长 的 参数 列表 ， 应 用 程序 只 需 向 
new 操作 符 提 供 一 个 值 。 而 晒 数 的 调用 协议 必须 设计 成 能 够 处 理 任意 数量 的 参数 。 比 如 ， 如 
果 参 数列 表 有 4 个 参数 ， 那 么 Pep/8 的 CPU 中 就 没有 足够 的 寄存 器 来 全 部 保存 它们 ， 但 是 
运行 时 栈 可 以 存储 任意 数量 的 参数 。 其 次 ，new 操作 符 不 会 调用 任何 其 他 的 函数 ， 尤 其 是 没 
有 递归 调用 。 顶 数 的 调用 协议 一 般 来 说 要 设计 成 允许 困 数 递归 地 调用 其 他 函数 ， 这 样 的 调用 
必须 要 使 用 运行 时 栈 ， 但 是 对 于 new 操作 符 来 说 是 不 必要 的 。 

图 6-42a 展示 了 这 个 HOL6 层 的 C++ 程序 在 第 一 个 cout 语句 之 前 的 内 存 分 配 ， 它 对 应 
于 图 2-38h。 图 6-42b 展示 了 Asmb5 层 上 同样 的 内 存 分 配 。 全 局 指针 a、b 和 c 分 别 存储 在 
0003、0005 和 0007。 与 所 有 的 全 局 变量 一 样 ， 用 .BLOCK 语句 对 它们 进行 分 配 


a: .BLOCK 2 0003 | 0078 | a 
b: .BLOCK 2 
c: .BLOCK 2 0005 | 0078 | b 
re 0007 | 0076 | c 
HOL6 层 的 指针 就 是 Asmb5 层 的 地 a 
rap H- Aa 从 b | 5 | as 
址 ， 地 址 占用 2 字 节 ， 因 此 给 每 个 全 局 指 0076 = 
针 分 配 2 字 节 。 c 0078 
2 EAS Ee J a) HOL6 层 的 全 局 指针 b) Asmbs 层 的 全 局 指针 
5 REN UES 图 6-42 图 6-41 在 第 一 条 cout 语句 之 前 的 内 存 分 配 
翻译 成 
main: LDA 2,7 
CALL new 
STA a,c 


LDA 指令 把 2 MARINE. CALL 指令 调用 new RER, new 操作 符 在 堆 上 分 配 2 字 节 
的 存储 空间 ， 再 把 指向 分 配 空间 的 指针 放 到 变 址 寄存 器 中 。STX 指令 把 返回 的 指针 存储 在 全 
局 变量 a 中 。 因 为 a 是 全 局 变量 ， 所 以 STX 使 用 直接 寻 址 。 在 这 一 系列 指令 执行 之 后 ，a 的 
值 是 0076，hpPtr 的 值 是 0078 ， 因 为 它 增 加 了 2. 

编译 硕 怎 样 翻 译 下 面 这 条 语句 呢 ? 

“a = $; 
当 程 序 执行 到 此 ， 全 局 变量 a 存放 的 是 存储 5 的 地 方 的 地 址 (这 个 执行 点 不 对 应 于 图 6-42, 
它 是 后 面 的 情况 )。store 指令 不 能 使 用 直接 寻 址 ， 因 为 这 样 会 把 地 址 替换 为 5，5 不 是 堆 上 
已 分 配 单 元 的 地 址 。Pep/8 提供 间接 寻 址 方式 ， 操 作 数 是 这 样 计算 的 

Oprnd = Mem [Mem[OprndSpec]] 
使 用 间接 寻 址 ， 操 作 数 指示 符 是 内 存 中 操作 数 的 地 址 。 编 译 器 把 赋值 语句 翻译 为 


LDA 5,i 
STA a,n 


STA 语句 中 的 n 表示 间接 寻 址 。 程 序 此 时 这 样 计 算 操作 数 

Mem[Mem[OprndSpec]] 

Mem[Mem[0003]] 

Mem[0076] 
这 就 是 堆 上 的 第 一 个 单元 。store 指令 把 5 存储 在 主 存 中 地 址 为 0076 的 位 置 。 

编译 器 对 全 局 指针 赋值 的 翻译 与 对 任何 其 他 类 型 全 局 变量 赋值 的 翻译 是 一 样 的 。 它 用 间 
接 寻 址 把 


204 和 四 部 分 LHA(FISA) 


C= d; 
翻译 为 
LDA a,d 
STA c,d 


程序 在 此 时 ，a 包含 0076， 即 堆 上 第 一 个 单元 的 地 址 。 赋 值 语句 赋 给 c 同样 的 值 ， 即 堆 上 第 
一 个 单元 的 地 址 ， 所 以 c 指向 a 指向 的 同一 地 址 。 

对 比 访 问 全 局 指针 和 访问 它 指 向 的 单元 。 编 译 需 将 

“a = 2+ Ses 
翻译 为 

LDA 2,71 


ADDA c,n 
STA a,n 


这 里 add 和 store 指令 使 用 间接 寻 址 方式 。 访 问 全 局 指针 使 用 直接 寻 址 ， 而 访问 全 局 指针 
指 癌 的 单元 使 用 间接 寻 址 。 可 以 看 到 同样 的 规则 适用 于 cout 语句 的 翻译 。 因 为 cout 输出 
*a， 即 a 指向 的 单元 ， 所 以 003F 的 DECO 指令 使 用 间接 寻 址 。 

总 之 ， 为 了 访问 全 局 指针 ， 编 译 需 遵循 如 下 规则 生成 代码 : 

e 用 .BLOCK 2 给 指针 分 配 存储 空间 ， 因 为 一 个 地 址 占用 2 字 市 。 

e 用 直接 寻 址 访问 指针 。 

e 用 间接 寻 址 访问 指针 指 问 的 单元 。 


6.5.2 ”翻译 局 部 指针 
除了 指针 a、b Alc 声明 为 局 部 变量 而 不 是 全 局 变量 外 ， 图 6-43 中 的 程序 与 图 6-41 中 


的 程序 是 一 样 的 。 这 两 个 程序 的 输出 没有 什么 不 同 , 但 是 内 存 模 型 是 完全 不 同 的 ， 因 为 这 个 
程序 的 指针 是 在 运行 时 栈 上 分 配 的 。 


高 级 语言 


#include <iostream> 


using namespace std; 


int main () { 
IARE *a, FD, *c; 
a = new int; 
*q = 5; 
b = new int; 
*D = 3: 
c= a; 
a= b; 
kg = 2 + Kes 
cout << "*a = " << *a << endl; 
cout << “xD = " << * << endl: 
cout << "*c = " << *c << endl; 
return 0; 
} 
汇编 语言 
0000 040003 





图 6-43 ”局 部 指针 的 翻译 
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， 交火 太太 大 大大 main () 




































as .EQUATE 4 ;local variable #2h 
b: .EQUATE 2 ;local variable #2h 
C: .EQUATE 0 ;1ocal variable #2h 
0003 680006 main: SUBSP 6,i ;allocate #a #b #c 
0006 C00002 LDA 2,1 ;a = new int 
0009 16006A CALL new ;#a 
000C EB0004 STX a,s 
000F C00005 LDA 5,1 sta = 5 
0012 £40004 STA a,sf 
0015 C00002 LDA eit ;b = new int 
0018 16006A CALL new ;#b 
001B EB0002 STX b , S 
001E C00003 LDA < :*b = 3 
0021 E40002 STA b, sf 
0024 C30004 LDA a,s :c =a 
0027 £30000 STA CS 
002A C30002 LDA b,s :a =b 
002D E30004 STA a,s 
0030 C00002 LDA 2.4 s*a = 2 +*c 
0033 740000 ADDA C, Sf 
0036 £40004 STA a,sf 
0039 410058 STRO msg0 ,d scout << "*a =" 
003C 3C0004 DECO a,sf : << *a 
003F 50000A CHARO  '\n’,i ; << endl 
0042 41005E STRO msgl,d scout << “xb = " 
0045 3C0002 DECO b,sf ; << xb 
0048 50000A CHARO  '\n',i ; << endl 
004B 410064 STRO msg2,d scout << "*c =" 
004E 3C0000 DECO cist 2 «< 二 
0051 50000A CHARO  '\n',i ; 《< end] 
0054 600006 ADDSP 6,i ;deallocate #c #b #a 
0057 00 STOP 
0058 2A6120 msg0: .ASCII "*a = \x00" 
3D2000 
005E 2A6220 msgl: ASCII "*b = \x00" 
302000 
0064 2A6320 msg2: ASCII "we = \x00" 
302000 





KKK KKKE 
» 















operator new 
; Precondition: A contains number of bytes 
Postcondition: X contains pointer to bytes 





006A (C90074 new: LDX hpPtr,d ;returned pointer 

006D 710074 ADDA hpPtr,d ;allocate from heap 

0070 £10074 STA hpPtr,d ;update hpPtr 

0073 58 RETO 

0074 0076 hpPtr: .ADDRSS heap ;address of next free byte 
0076 00 heap: .BLOCK 1 ;first byte in the heap 


.END 


图 6-43 ( 续 ) 


图 6-44 展示 了 图 6-43 中 程序 在 执行 第 一 条 cout 语句 前 的 内 存 分配 ， 与 所 有 局 部 变量 
一 样 ，a、b Alc 在 运行 时 栈 进行 分 配 。 图 6-44b 显示 了 它们 距 栈 顶 的 偏 移 量 分 别 为 4、2 和 
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0, Ak, Sanitary 
int *a, *b, *c; 
翻译 为 
a: ,EQUATE 4 


Db: EQUATE 2 
Cc: .EQUATE 0 


AlN a. b Alc 是 局 部 变量 ， 所 以 编译 器 用 SUBSP 给 它们 生成 分 配 存储 空间 的 代码 ， 用 
ADDSP 生成 释放 存储 空间 的 代码 。 0076 
编译 项 将 0078 


a = new int; c 一 SP —> 0 FBC9 
翻译 为 b 2 FBCB 
LDA 2,7 a 4 FBCD 


CALL 的 局 部 指 入 
ee AOL5 层 的 局 部 弛 指针 b) Asmb5 层 的 局 部 指针 


LDA 指令 把 2 放 入 累加 器 ， 为 调用 图 6-44 图 6-43 在 cout 语句 之 前 的 内 存 分 配 
new 操作 符 做 准备 ， 放 入 2 是 因为 整数 占用 2 字 节 。CALL 指令 调用 new 操作 符 ，new 操作 
和 从 在 堆 上 分 配 2 字 节 ， 把 它们 的 地 址 放 进 变 址 寄存 器 。 一 般 来 说 ， 给 局 部 变量 赋值 用 栈 相对 
寻 址 ， 因 此 STX 语句 用 栈 相对 寻 址 把 这 个 地 址 赋值 给 ao 

编译 希 怎 样 翻译 下 面 这 个 赋值 呢 ? 

ta = Gs 
a 是 指针 ， 把 a 指向 的 单元 赋值 为 5。a 也 是 一 个 局 部 变量 。 这 种 情形 与 图 6-27 和 图 6-29 
中 程序 的 传 引用 调用 参数 一 样 ， 即 操作 数 的 地 址 在 运行 时 栈 上 。 编 译 器 把 赋值 语句 翻 
译 为 

LDA 5,1 

STA a,Sf 
XE, store 语句 使 用 栈 相 对 间接 寻 址 。 

编译 希 对 局 部 指针 赋值 的 翻译 与 对 任何 其 他 类 型 的 局 部 变量 赋值 的 翻译 是 一 样 的 。 它 使 
用 栈 相 对 寻 址 把 
翻译 为 

LDA a,s 

STA Cs 


这 时 在 程序 中 ，a 包含 0076， 即 堆 上 第 一 个 单元 的 地 址 。 赋 值 语句 给 c 同样 的 值 ， 即 堆 
上 第 一 个 单元 的 地 址 ， 所 以 c 指向 a 指向 的 同一 单元 。 

编译 器 将 

“a @ 2 ey 
翻译 为 

EDA -2,1 


ADDA c,sf 
STA a,sf 


这 里 add 指令 使 用 栈 相 对 间接 寻 址 来 访问 c 指 回 的 单元 ，store 指令 使 用 栈 相 对 间接 寻 址 
来 访问 a 指向 的 单元 。 同 样 的 规则 适用 于 cout 语句 ， 这 里 DECO 指令 也 使 用 栈 相 对 间 
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接 寻 址 。 
总 之 ， 为 了 访问 局 部 指针 ， 编 译 器 遵循 如 下 规则 生成 代码 : 
e 用 SUBSP 在 运行 时 栈 给 指针 分 配 存储 空间 ， 用 ADDSP 释放 存储 空间 。 
e 用 栈 相 对 寻 址 访问 指针 。 
e 用 栈 相 对 间接 寻 址 访问 指针 指向 的 单元 。 


6.5.3 ”翻译 结构 


在 HOL6 层 ， 高 级 语言 层 ， 结 构 是 数据 抽象 的 关键 。 它 允许 程序 员 把 原始 类 型 的 变量 整 
合 为 一 个 抽象 数据 类 型 。 编 译 器 在 HOL6 层 提供 struct 结构 。 在 Asmb5 汇编 层 ， 结 构 是 
一 个 连续 的 字 节 组 ， 非 常 像 数 组 字 节 。 但 是 数组 的 所 有 单元 都 具有 相同 的 类 型 ， 因 此 具有 相 
同 的 大 小 ， 通 过 索引 的 整数 值 来 访问 每 个 单元 。 

使 用 结构 ， 单 元 可 以 有 不 同 的 类 型 和 不 同 的 大 小 。C++ 程序 员 给 每 个 称 为 字段 的 单元 一 
个 字段 名 。 在 Asmb5 E, 字段 名 对 应 于 该 字段 距离 结构 第 一 个 字 节 的 偶 移 量 。 结 构 的 字段 名 
对 应 于 数组 的 索引 。 访 问 结构 的 字段 与 访问 数组 的 元 素 类 似 ， 这 也 就 一 点 都 不 奇怪 了 。 编 译 前 
不 是 把 数组 的 索引 放 入 变 址 寄存 器 ， 而 是 生成 把 字段 距离 结构 第 一 个 字 节 的 偏 移 量 放 入 变 址 寄 
存 器 的 代码 。 除 了 这 一 点 不 同 外 ， 访 问 结构 字段 的 代码 和 访问 数组 元 素 的 代码 是 一 样 的 。 

图 6-45 中 的 程序 ， 声 明了 一 个 叫 作 person AY struct, person 有 4 个 字段 ，first、 
last, age Ñl genders, CAIK 2-39 中 的 程序 是 一 样 的 。 它 声明 了 一 个 叫 作 bill 的 全 局 变量 ， 
bill 的 类 型 是 person。 图 6-46 展示 了 这 个 结构 在 HOL6 层 和 Asmb5 层 的 存储 空间 分 配 。 字 
Et first, last 和 gender 的 类 型 是 char， 每 个 字段 占用 1 字 节 ， 字 段 age 的 类 型 是 int, 
占用 2 字 节 。 图 6-46b 给 出 了 结构 每 个 字段 的 地 址 ， 地 址 左边 是 距离 结构 第 一 个 字 节 的 偏 移 
量 。 除 了 没有 对 应 于 SP 的 到 结构 顶部 的 指针 外 ， 结 构 的 偏 移 量 类 似 于 栈 上 元 素 的 偏 移 量 。 


高 级 语言 


fHinclude <iostream> 
using namespace std; 


struct person { 
char first; 
char last; 
int age; 
char gender; 

i 

person bill; 


int main () { 
cin >> bill.first >> bill.last >> bill.age >> bill.gender; 
cout << “Initials: " << bill. first << bill.last << endl; 
cout << "Age: ™ << bill.age << endl; 
cout << “Gender: " 
if (bill.gender == ‘m') { 
cout << “male\n"; 
} 
else { 





图 6-45 结构 的 翻译 。 该 C++ 程序 来 自 图 2-39 
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cout << “female\n"; 
} 


return 0; 
} 
汇编 语言 
0000 040008 BR main 
first: .EQUATE 0 ¿struct field #1c 
last: .EQUATE 1 :struct field #1c 
age: .EQUATE 2 :Struct field #2d 
gender: „EQUATE 4 ;Struct field #lc 
0003 000000 bill: .BLOCK 5 :global variable #first #last #age #gender 
0000 


， 太太 太太 大 大 大 main () 


0008 C80000 main: LDX first..1 scin >> DITI. First 
000B 400003 CHARI bill,x 

000E C80001 LDX last,i : >>bill.last 

0011 4D0003 CHARI Dil x 

0014 C80002 LDX age, i : >>bill.age 

0017 350003 DECI bill,x 

001A C80004 LDX gender,i : >>bill.gender 
001D 400003 CHARI bill,x 

0020 41005A STRO msg0,d scout << “Initials: T 
0023 C80000 LDX first,i - << billəfirst 
0026 550003 CHARO bill,x 

0029 C80001 LDX last,i : << bill.last 
002C 550003 CHARO bill,x 

002F 50000A CHARO a i ; << endl 

0032 410065 STRO msgl,d scout << “Age: ” 
0035 C80002 LDX age, i << bill.age 

0038 3D0003 DECO bY] 15x 

003B 50000A CHARO wT a | : << endl; 

003E 410068 STRO msg2,d scout << “Gender: " 
0041 C80004 LDX gender,i sif (bill.gender == ‘m') 
0044 C00000 LDA 0,7 

0047 D50003 LDBYTEA bill,x 

004A B0006D CPA W ga 

004D 0C0056 BRNE else 

0050 410074 STRO msg3,d : cout << "male\n" 
0053 040059 BR endif 

0056 41007A else: STRO msg4,d : cout << “female\n" 
0059 00 endif: STOP 

005A 496E69 msg0: -ASCII “Initials: \x00" 

0065 416765 msgl: -ASCII “Age: \x00" 

006B 47656E msg2: -ASCII “Gender: \x00" 

0074 6D616C msg3: .ASCII "“male\n\x00" 

007A 66656D msg4: .ASCII “female\n\x00" 

0082 . END 


图 6-45 ( 续 ) 
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输入 


输出 


Initials: bj 
Age: 32 
Gender: male 





图 6-45 ( 续 ) 

编译 器 用 .EQUATE 点 命令 把 
struct person { 

char first; 

char last; 

int age; 

char gender; bill.first 
Ps bill.last 

翻译 为 bill.age 





bill.gender 
first: .EQUATE 0 
last: „EQUATE 1 a) HOL6 层 的 全 局 结构 b) Asmb5 层 的 全 局 结构 


age: .EQUATE 2 图 6-46 图 6-45 在 cin 语句 之 后 的 内 存 分 配 
gender: .EQUATE 4 


字段 名 等 于 字段 距离 结构 第 一 个 字 节 的 偶 移 量 。 因 为 first 是 结构 的 第 一 个 字 节 ， 所 
以 first 等 于 0。 由 于 first 占用 1 字 节 ， 所 以 last 等 于 1。 因 为 first M last HAA 
2 字 节 ， 所 以 age 等 于 2。gender 等 于 4， 因 为 first、1ast 和 age 总 共 占 用 4 字 节 。 编 
译 需 把 全 局 变量 

person bill; 
MIEN 

bill: .BLOCK 5 
它 保留 SSW, AWN first, last, age 和 gender BE GAS 5 个 字 节 。 

要 访问 全 局 结构 的 字段 ， 编 译 器 生成 把 字段 距离 结构 第 一 个 字 节 的 偏 移 量 装 人 变 址 寄存 
做 的 代码 ， wa 用 同样 的 方式 访问 结构 的 字段 。 
PON, Saree se 


cin >> bill.age 
MEN 

LDX age,i 

DECI DTTL, X 


装 人 指令 用 立即 数 寻 址 把 字段 age 的 偏 移 量 装 入 变 址 寄存 器 ， 十 进 制 输入 指令 用 变 址 
寻 址 来 访问 这 个 字段 。 

编译 怖 类 似 地 把 

if (bill.gender == ‘'m') 
翻译 为 


LDX gender,i 


310 
313 
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LDA 0,7 
LDBYTEA bill,x 
CPA *m' i 


第 一 个 装 人 指令 把 gender 字段 的 偏 移 量 装 人 变 址 寄存 器 ， 第 二 个 装 人 指令 清除 累加 
器 ， 确 保 它 最 左边 的 字 节 为 全 0 用 于 比较 。 装 人 字 节 指令 用 变 址 寻 址 方式 访问 结构 的 字段 ， 
并 把 它 放 人 累加 堪 最 在 的 字 节 。 最 后 ， 比 较 指 令 比 较 bi11.gender 和 字母 m。 

总 之 ， 为 了 访问 一 个 全 局 结构 ， 编 译 器 遵循 如 下 规则 生成 代码 : 

e 结构 的 每 个 字段 等 于 它 距 离 结构 第 一 个 字 节 的 偏 移 量 。 

e 用 .BLOCK tot 给 结构 分 配 存储 空间 ，tot 是 结构 占用 的 总 字 节 数 。 

e 通过 用 立即 数 寻 址 把 字段 的 偏 移 量 装 人 变 址 寄存 器 ， 后 面 跟 一 条 使 用 变 址 寻 址 方式 

的 指令 来 访问 结构 的 字段 。 

访问 全 局 结构 的 字段 类 似 于 访问 全 局 数组 的 元 素 ， 与 此 方式 相同 ， 访 问 局 部 结构 的 字段 
类 似 于 访问 局 部 数组 的 元 素 。 局 部 结构 在 运行 时 栈 上 分 配 ， 每 个 字段 的 名 字 等 于 它 距离 结构 
第 一 个 字 节 的 偏 移 量 ， 局 部 结构 的 名 字 等 于 它 距 离 栈 顶 的 偏 移 量 。 编 译 器 生成 SUBSP 给 结 
构 和 任何 其 他 局 部 变量 分 配 存储 空间 ，ADDSP 释放 存储 空间 。 通 过 用 立即 数 寻 址 方式 把 字段 
的 偏 移 量 装 入 变 址 寄存 器 中 ， 后 面 跟 一 个 使 用 栈 变 址 寻 址 方式 的 指令 来 访问 结构 的 字段 。 本 
章 后 面 有 一 道 给 学 生出 的 问题 ， 要 求 翻 译 一 个 有 局 部 结构 的 程序 。 


6.5.4 ”翻译 链 式 数据 结构 


程序 员 经 常 把 指针 和 结构 结合 在 一 起 来 实现 链 式 数据 结构 。struct 通常 称 为 结 点 ， 指 
针 指 同 结 点 ， 结 点 有 一 个 指针 字段 。 在 数据 结构 中 ， 结 点 的 指针 字段 作为 到 另 一 个 结 点 的 链 
接 。 图 6-47 是 一 个 实现 了 链 式 数据 结构 的 程序 ， 它 和 图 2-40 的 程序 是 一 样 的 。 


高 级 语言 


#include <iostream> 
using namespace std; 


Struct node { 
int data; 
node* next; 
E- 
int main () { 
node *first, *p; 


int value; 

first = 0; 

cin >> value; 

while (value != -9999) { 
p = first; 
first = new node; 
first->data = value; 
first->next = p; 
cin >> value; 

} 

for (p = first; p != 0; p = p->next) { 
cout << p->data << ' '; 

} 





图 6-47 链表 的 翻译 。 该 C++ 程序 来 自 图 2-40 
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return 0; 
} 


汇编 语言 
0000 040003 BR 


data: . EQUATE 
next: . EQUATE 


;Struct field #2d 
;Struct field #2h 
。 大 大大 火 大 大 大 main ( ) 
first: . EQUATE 
p: . EQUATE 
value: . EQUATE 
680006 main: SUBSP 
C00000 LDA 
E30004 STA 
330000 DECI 
C30000 LDA 
B0D8F 1 CPA 
0A003F BREQ endWh 
C30004 LDA first,s 
£30002 STA p,s 
C00004 LDA 4,1 
160067 CALL new 
EB0004 STX firsts 
C30000 LDA value,s 
C80000 LDX data,i 
E70004 STA first, sxf 
C30002 LDA DS 
C80002 LDX next,i 
£70004 STA first,sxf 
330000 DECI value,s 
04000F BR while 
C30004 LDA first,s 
E30002 STA p,s 
C30002 : LDA p,s 
B00000 CPA 0,7 
0A0063 BREQ endFor 
C80000 LDX data,i 
3F0002 DECO p,sxf 
500020 CHARO at, 
C80002 LDX next,i 
C70002 LDA p,sxf 
E30002 STA DisS 
040045 BR for 
600006 ADDSP 6,i 
00 STOP 
;太太 A operator new 
Precondition: A contains number of bytes 
Postcondition: X contains pointer to bytes 


:local variable #2h 

;local variable #2h 

;local variable #2d 

sallocate #first #p #value 

;first = 0 
first,s 
value,s 
value,s 
-9999 ,1 


:Cin >> value 


swhile (value != -9999) 


p = first 


first = new node 
allocate #data next 


first->data = value 


first->next = p 


cin >> value 


;for (p = first 


p != 0 


cout << p->data 


<< ' ' 
p = p->next) 


;deallocate #value #p #first 


C90071 
710071 
£10071 
58 





LDX hpPtr,d ;returned pointer 
ADDA hpPtr,d ;allocate from heap 
STA hpPtr,d ;update hpPtr 

RETO 


图 6-47 (2B) 
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0073 + hpPtr: .ADDRSS heap ;address of next free byte 
00 heap: -BLOGK 1 ;first byte in the heap 
. END 


it 


10 20 30 40 -9999 


输出 
40 30 20 10 





6-47 ( 续 ) 
编译 需 把 结构 的 字段 


struct node | 
int data; 
node* next; 
je 


设置 为 它们 距离 结构 第 一 个 字 节 的 偏 移 量 ，data 是 第 一 个 字段 ， 偏 移 量 是 0，next 是 第 二 
个 字段 ， 偏 移 量 为 2， 因 为 data 占用 了 2 字 节 。 翻 译 为 


data: .EQUATE 0 
next: .EQUATE 2 


编译 絮 像 翻译 所 有 局 部 变量 一 样 翻译 这 些 局 部 变量 
node *first, *p; 
int value; 


它 把 变量 名 设置 为 距离 运行 时 栈 顶 部 的 偏 移 量 ， 翻 译 为 
first: .EQUATE 4 


p: . EQUATE 2 
value: .EQUATE 0 


图 6-48b 展示 了 这 些 局 部 变量 的 偶 移 量 。 编 译 需 在 0003 生成 SUBSP， 给 局 部 变量 分 配 
存储 空间 ， 在 0063 的 ADDSP 释放 存储 空间 。 


0073 
0075 
0077 
0079 
007B 
007D 





value §-999 







SP .一 > 0 FBC9 |-9999| value 
2 FBCB | 0077 | p 
4 FBCD first 


a) HOL6 层 的 链表 b) Asmbs 层 的 链表 
图 6-48 图 6-47 在 第 三 次 执行 while 循环 后 的 内 存 分 配 
当 在 C++ 中 使 用 new 操作 符 时 ， 计 算 机 必须 在 堆 上 分 配 足 够 的 内 存 来 存储 指针 指 回 的 
条 目 。 在 这 个 程序 中 ， 一 个 结 点 占用 4 字 节 ， 因 此 ,编译 右 通过 在 它 生成 的 代码 中 调用 new 
操作 符 分 配 4 字 节 来 将 


first = new node; 


first 
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翻译 为 
LDA 4,i 
CALL new 
STX fFITASE,S 


在 准备 调用 new 时 ， 装 和 指令 把 4 放 和 人 累加 器 ， 调 用 指令 调用 new 操作 符 ，new 操作 
符 把 被 分 配 结 点 的 第 一 个 字 节 的 地 址 放 入 变 址 寄存 右 ， 和 存储 索引 指令 用 栈 相对 寻 址 完成 给 局 
部 变量 first 赋值 。 

编译 器 是 怎样 生成 访问 局 部 指针 所 指向 的 结 点 字段 的 代码 呢 ? 记 住 指针 是 一 个 地 址 ， 局 
部 指针 意味 着 结 点 的 地 址 在 运行 时 栈 上 。 此 外 ，struct 的 字段 对 应 于 数组 的 索引 。 如 果 数 
组 第 一 个 单元 的 地 址 在 运行 时 栈 上 ， 那 么 用 栈 变 址 间接 寻 址 访问 数组 元 素 ， 访问 结 点 的 字段 
也 用 同样 的 方法 。 把 字段 偏 移 量 而 不 是 索引 值 放 人 变 址 寄存 顺 中 。 编 译 顺 将 

first->data = value; 
翻译 为 

LDA value,s 


LDX data,i 
STA First. Skt 


ZEW HE, Sa PEAR 

first->next = p; 
HEN 

LDA p,s 


LOX next, i 
STA TIPSt.. Skt 


来 看 一 看 指向 结 点 的 局 部 指针 怎样 使 用 栈 变 址 间接 寻 址 ， 记 住 CPU 这 样 计 算 操 作 数 

Oprnd = Mem[Mem[SP + OprndSpec] + X] 
ERE BETS ET PRE BE nN FA, FER AEA BT SR, FREE Dn BEE AF A at 
上 。 假定 第 三 个 结 点 已 经 如 图 6-48b 所 示 的 那样 分 配 了 。 调 用 new 已 经 返回 最 新 分 配 的 结 点 
地 址 007B， 把 它 存储 在 First 中 。 这 时 上 面 的 LDA 指令 已 经 把 p 的 值 0077 MA RIMAE o 
LDX 指令 也 已 把 next 值 ， 即 偏 移 量 2 放 人 变 址 寄存 器 。 用 栈 变 址 寻 址 执行 STA 指令 ， 操 作 
数 指示 符 是 4， 即 first 值 。 操 作 数 的 计算 为 

Mem[Mem[SP + OprndSpec] + X] 

Mem[Mem[FBC9 + 4] + 2] 

Mem[Mem[FBCD] + 2] 

Mem[Mem[007B + 2] 

Mem[007D] 
这 是 first 指 癌 的 结 点 的 next 字段 。 

总 之 ， 为 了 访问 局 部 指针 指向 的 结 点 的 字段 ， 编 译 需 遵循 如 下 生成 代码 : 

e 结 点 的 字段 名 等 于 字段 距离 结 点 第 一 个 字 节 的 偏 移 量 ， 把 偏 移 量 装 入 变 址 寄存 器 。 

e 访问 结 点 字段 的 指令 使 用 栈 索 引 间 接 寻 址 。 

你 应 该 能 够 确定 编译 器 是 怎样 翻译 全 局 指针 指向 的 结 点 的 程序 了 吧 。 本 章 末 尾 有 一 个 
给 学 生 的 练习 就 是 归纳 总 结 这 个 翻译 规则 ， 还 有 一 道 问题 是 翻译 具有 指向 结 点 的 全 局 指针 的 
C++ 程序 。 
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总 结 


编译 器 用 机 器 层 的 条 件 转移 指令 翻译 高 级 语言 层 的 if 语句 和 循环 。if/el1se 语句 需要 
一 个 条 件 转移 指令 测试 if ALF, else 部 分 需要 一 个 无 条 件 转移 指令 。while 或 do 循环 的 
翻译 需要 一 个 跳 转 到 前 面 指令 的 转移 。 除 此 之 外 ，for 循环 还 需要 指令 初始 化 和 递增 控制 
变量 。 

Bohm 和 Jacopini 证 明 的 结构 化 编程 原理 认为 任何 包含 goto 的 算法 ， 不 管 多 么 复杂 和 无 
Zi, ABA] LA AE if 语句 和 while 循环 来 编写 。Dijkstra 那 封闭 名 的 信 中 指明 没有 goto 
的 程序 不 仅 可 行 而 且 更 好 ， 并 由 此 引发 了 针对 goto 的 争论 。 

编译 器 在 主 存 的 固定 位 置 分 配 全 局 变量 ， 过 程 和 上 盟 数 在 运行 时 栈 上 分 配 参 数 和 局 部 变 
量 。 通 过 增 大 栈 指针 (SP)， 值 被 压 人 栈 中 ; 通过 减 小 SP， 值 弹出 栈 。 子 程序 调用 指令 把 程 
序 计 数 器 (PC) 的 内 容 ， 充 当 返 回 地 址 ， 压 人 栈 中 。 子 程序 返回 指令 把 返回 地 址 从 栈 弹 出 到 
PC。 指 令 用 直接 寻 址 方式 访问 全 局 值 ， 运 行 时 栈 上 的 值 用 栈 相 对 寻 址 来 访问 。 传 引用 调用 
的 参数 会 把 它 的 地 址 压 人 运行 时 栈 中 ， 然 后 用 栈 相 对 间接 寻 址 来 访问 这 样 的 参数 。 布 尔 变 量 
的 false(〈 假 ) 存储 为 值 0，true( 真 ) 存储 为 值 1。 

数组 值 存 储 在 连续 的 内 存单 元 中 。 用 变 址 寻 址 访问 全 局 数组 的 元 素 ， 用 栈 变 址 寻 址 来 访问 
局 部 数组 的 元 素 。 两 种 情况 下 ， 变 址 寄存 器 都 包含 数组 元 素 的 索引 值 。 作 为 参数 传递 的 数组 总 
是 把 数组 第 一 个 单元 的 地 址 压 和 人 运行 时 栈 。 用 栈 变 址 间接 寻 址 来 访问 这 样 数组 的 元 素 。 编 译 需 
用 一 个 地 址 数组 来 翻译 switch 语句 ， 该 数组 的 元 素 是 每 个 case 第 一 条 语句 的 地 址 。 

指针 和 struct 类 型 是 数据 结构 的 常用 构件 。 指 针 是 堆 上 一 个 内 存单 元 的 地 址 。new 操作 
符 在 堆 上 分 配 内 存 。 用 非 直接 寻 址 来 访问 全 局 指针 指 加 的 单元 ， 用 栈 相 对 间接 寻 址 来 访问 局 部 
指针 指 回 的 单元 。struct 有 多 个 命名 的 字段 ， 存 储 为 一 个 连续 的 字 节 组 。 用 变 址 寻 址 来 访问 
global 结构 的 字段 ， 变 址 寄存 器 包含 字段 距离 struct 第 一 个 字 节 的 偶 移 量 。 链 式 数 据 结 构 
通常 有 一 个 指向 struct 的 指针 ， 这 个 struct 称 为 结 点 ， 这 个 结 点 又 含有 指向 另 一 个 结 点 的 
指针 。 如 果 局 部 指针 指 回 一 个 结 点 ， 那 么 使 用 栈 变 址 间接 寻 址 来 访问 该 结 点 的 字段 。 


练习 


6.1% 
1. 请 解释 全 局 变量 和 局 部 变量 内 存 模型 的 不 同 点 。 它 们 是 怎样 分 配 和 存 取 的 ? 
6.2 节 
2. 什么 是 优化 编译 器 ? 什么 时 候 使 用 ? 什么 时 候 不 使 用 ? 请 解释 。 
*3. 图 6-14 中 目标 代码 在 000C 处 的 CPA 测试 j 的 值 。 由 于 程序 从 循环 底部 跳 转 到 那 条 指令 ， 为 什么 
编译 器 此 时 不 在 CPA 之 前 生成 一 条 LDA j，d 语句 ? 
4. 研究 图 6-16 神秘 程序 的 函数 ， 用 一 句 简短 的 话说 明 它 是 做 什么 的 ? 
5. 阅读 本 章 所 引用 的 Bohm, Jacopini 以 及 Dijkstra 的 论文 ， 据 此 写 一 篇 综述 文章 。 
6.3 节 
*6. 像 图 6-19 那样 画 出 图 6-18 中 0022 处 的 CALL 语句 之 前 和 之 后 的 值 。 
7. 像 图 6-26 那样 画 出 对 应 于 第 二 次 返回 前 的 运行 时 栈 。 
6.4 节 
*8. 在 图 6.40 的 Pep/8 程序 中 ， 如 果 给 Guess 输入 4， 在 0010 的 转移 之 后 执行 什么 语句 ?为 什么 ? 
9. 6.4 节 没 有 展示 怎样 访问 二 维 数组 的 元 素 。 描 述 可 以 怎样 存储 二 维 数组 ， 以 及 从 这 样 的 二 维 数组 存 
取 元 素 所 需 的 汇编 语言 目标 代码 。 
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6.5 7 
10. 访问 全 局 指针 指向 结 点 的 字段 的 转换 规则 是 什么 ? 


问题 
6.2 节 
11. 将 下 列 C++ 程序 翻译 为 Pep/8 汇编 语言 : 


#include <iostream> 
using namespace std; 


int main () { 
int number; 
cin >> number; 
if (number % 2 == 0) { 
cout << "Even\n"; 


} 
else { 
cout << "Odd\n"; 
} 
return 0; 


} 
12. 将 下 列 C++ 程序 翻译 为 Pep/8 汇编 语言 : 


#include <iostream> 
using namespace std; 


const int limit = 5; 


int main () { 
int number; 
cin >> number; 
while (number < limit) { 
number++; 
cout << number << ' '; 
} 
return 0; 
} 


13. 将 下 列 C++ 程序 翻译 为 Pep/8 汇编 语言 : 


#include <iostream> 
using namespace std; 


int main () { 
char ch; 
cin >> ch; 
if ((ch >= 'A') && (ch <= ‘'Z')) { 
cout. << "ATR 
} . 
else if ((ch >= 'a') && (ch <= 'z')) { 


cout << ‘a’: 


} 
else { 

cout << 1$" 
} 
cout << endl; 
return 0; 


} 


14. 将 图 6-12 的 C++ 程序 翻译 为 Pep/8 汇编 语言 ， 但 是 把 do 循环 的 测试 条 件 改 为 


£15 
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while (cop <= driver); 
15. 将 下 列 C++ 程序 转换 为 Pep/8 汇编 语言 : 


#Hinclude <iostream> 
using namespace std; 


int main () { 
int numItms, j, data, sum; 
cin >> numItms; 
sum = 0; 
for (j= 1; j <= numItms; j++) { 
cin >> data; 
sum += data; 


} 
cout << "Sum: " << sum << endl; 
return 0; 

} 

示例 输入 

4 8 -3 7 6 

示例 输出 

Sum: 18 

6.3 $ 


16. 将 下 列 C++ 程序 翻译 为 Pep/8 汇编 语言 : 


#include <iostream> 
using namespace std; 


int myAge; 


void putNext (int age) { 

int nextYr; 

nextYr = age + 1; 

cout << “Age: " << age << endl; 

cout << “Age next year: ™ << nextYr << endl; 
} 


int main () { 
cin >> myAge; 
putNext (myAge ) ; 
putNext (64); 
return 0; 

} 


17. 将 上 面 习 题 16 中 的 C++ 程序 翻译 成 Pep/8 汇 编 语 言 ， 但 是 把 myAge 声明 成 main() 中 的 局 部 
变量 。 

18. 将 下 列 C++ 程序 转换 为 Pep/8 汇编 语言 。 它 用 递归 位 移 相 加 (recursive shift-and-add) 算法 进行 两 
个 整数 的 乘法 。 


#include <iostream> 
using namespace std; 


int times (int mpr, int mcand) { 
if (mpr = 0) { 
return 0; 
} 
else if (mpr % 2 == 1) { 
return times (mpr / 2, mcand * 2) + mcand; 
} 
else { 
return times (mpr / 2, mcand * 2); 
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} 
} 


int main () { 
tnt n; me 
cin >> n > m; 
cout << “Product: " << times :(n, m) << endl; 
return 0; 


} 
19. (a) 写 一 个 把 小 写字 母 转 换 成 大 写字 母 的 C++ FEAF. FER PRBS A 


char uppercase (char ch); 
WREDENS FE, KORE ANE SE FHA. MXE V0 在 主 程序 中 测试 你 的 函数 。(b) 把 
你 写 的 C++ 程序 翻译 成 Pep/8 汇编 语言 。 
20. (a) 写 一 个 C++ 程序 ， 定 义 
int minimum (int jl, int j2) 
返回 j1 和 j2 中 较 小 的 那个 ， 用 交互 输入 测试 这 个 程序 。(b) 把 你 写 的 C++ 程序 翻译 成 Pep/8 汇 | 7 
编 语 言 。 
21. 把 习题 2.14 中 用 递归 函数 计算 斐 波 那 契 数列 的 C++ 方案 翻译 成 Pep/8 汇编 语言 。 
22. 把 习题 2.15 中 输出 汉 诺 塔 游戏 输出 指令 的 C++ 方案 翻译 成 Pep/8 汇编 语言 。 
23. 图 6-25 的 递归 二 项 式 系数 函数 可 以 通过 像 下 面 那样 忽略 yl 和 y2 进行 简化 : 


— 


Ww 


int binCoeff (int n, int k) { 
if ((k == 0) || (n == k)) { 
return 1; 
} 
else { 
return binCoeff (n = 1, k) + binCoeff (n - 1, k - 1); 
} 
} 
写 一 个 Pep/8 汇编 语言 程序 ， 调 用 这 个 函数 。 把 从 binCoeff(n-1,k) 返回 的 值 保存 在 栈 上 ， 在 这 
个 值 上 面 给 binCcoeff(n-1,k-1) 调用 分 配 实 参 。 图 6-49 展示 了 运行 时 栈 的 历史 信息 ， 这 里 的 栈 
帧 包含 4 个 字 (retVal1、n、k 和 retAddr)， 阴 影 表 示 的 字 是 函数 调用 的 返回 值 ， 它 展示 从 主 程序 


中 调用 bincoeff(3,1) 的 历史 记录 。 


Vda | 7 7 7 7 7 7 7 站 J 
a) b) c) d) h) i) j) k) 


e) f) g) 
图 6-49 ”练习 23 的 运行 时 栈 历 史 状 态 


24. 将 下 列 C++ 程序 翻译 为 Pep/8 汇编 语言 ， 它 用 迭代 位 移 相 加 算法 进行 两 个 整数 的 乘法 。 


#include <iostream> 
using namespace std; 


int product, n, m; 
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void times (int& prod, int mpr, int mcand) { 
prod = 0; 
while (mpr != 0) { 
if (mpr % 2 == 1) { 
prod = prod + mcand; 
} 
mpr /= 2; 
mcand *= 2; 


} 


int main () { 
cin >> n >> m: 
times (product, n, m); 
cout << "Product: ™ << product << endl; 
return 0; 
} 


25. 将 问题 24 中 的 C++ 程序 翻译 为 Pep/8 汇编 语言 ， 但 是 把 product, n 和 m 声明 为 main() 的 局 部 
变量 。 

26. (a) 重 写 图 2-22 中 计算 阶乘 的 C++ 程序 ， 但 是 使 用 问题 24 中 的 times 过 程 来 进行 乘法 运算 。 在 
fact 中 用 一 个 额外 的 局 部 变量 来 存储 乘积 。(b) 将 你 写 的 C++ 程序 翻译 成 Pep/8 汇编 语言 。 

6.4 节 

27. 将 下 列 C++ 程序 翻译 为 Pep/8 汇编 语言 : 


#include <iostream> 
using namespace std; 


int list{16]; 
int j, numItems; 
int temp; 


int main () { 

cin >> numItems; 

for (j = 0; j < numItems; j++) { 
cin >> list{jl; 

} 

temp = list[{0]; 

for (j= 0; j < numItems - 1; j++) { 
list{j] = list{j + 1]; 

} 

list{numItems - 1] = temp: 

for (j = 0; j < numitems; j++) { 
cout << isti3z) << T "y 

} 

cout << endl; 

return 0; 


11 22 33 44 55 
示例 输出 

22 33 44 55 11 

第 二 个 for 循环 的 测试 很 难 翻译 ， 因 为 < 运算 符 右边 的 算术 表达 式 。 可 以 通过 把 这 个 测试 转换 成 
下 面 数 学 上 等 价 的 测试 来 简化 翻译 : 


j + 1 < numItems; 


28. 把 上 面 问 题 27 中 的 C++ 翻译 为 Pep/8 汇编 语言 ， 但 是 要 把 list. j, numItems Al temp 声明 成 
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main() 中 的 局 部 变量 。 
29. 将 下 列 C++ 程序 翻译 为 Pep/8 汇编 语言 : 


#include <iostream> 
using namespace std; 


void getList (int 1s[], int& n) { 
mE js 
cin >> n; 
for (J = OF 3 $ he JI) A 
cin >> Lest jis 
} 
} 


void putList (int Is[], int n) { 
int j; 
for (j = 0: J < nz j++) f{ 
cout << SLJ] << * *s 
} 
cout << endl; 
} 


void rotate (int 1s[], int n) { 
THE j; 
int temp; 
temp = 1s[0]; 
for (j= 0; j<n- 1; j+) { 
EJI = PIER 
} 
ls[n - 1] = temp; 
} 


int main () { 
int list{16]: 
int numItems; 
getList (list, numItems); 
putList (list, numItems); 
rotate (list, numItems); 
putList (list, numItems); 
return 0; 


11 22 33 44 55 
示例 输出 


11 22 33 44 55 
22 33 44 55 11 


30. 将 上 面 问题 29 中 的 C++ 程序 翻译 为 Pep/8 汇编 语言 ， 但 是 把 list 和 numItems 声明 为 全 局 变量 。 
31. 将 图 2-25 中 用 递归 程序 把 一 个 数组 中 4 个 值 相 加 的 C++ 程序 翻译 为 Pep/8 汇编 语言 。 

32. 将 图 2-32 用 递归 程序 反 转 数组 元 素 的 C++ 程序 翻译 为 Pep/8 汇编 语言 。 

33. 将 下 列 C++ 程序 翻译 为 Pep/8 汇编 语言 : 


#include <iostream> 
using namespace std; 


int main () { 
int guess; 
cout << "Pick a number 0..3: "; 
cin >> guess; 
switch (guess) { 
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case 0: case 1: cout << "Too low": break; 
case 2: cout << "Right on"; break; 
case 3: cout << "Too high"; 


} 
cout << endl; 
return 0; 


} 
这 个 程序 除了 两 种 情况 执行 相同 的 代码 外 ， 和 图 6-40 的 程序 是 一 样 的 。 跳 转 表 必须 正好 有 4 个 条 
目 ， 但 是 程序 必须 只 有 3 个 情况 符号 和 3 种 情况 。 

34. 将 下 列 C++ 程序 翻译 为 Pep/8 汇编 语言 : 


#include <iostream> 
` using namespace std; 


int main () { 

int guess; 

cout << "Pick a number 0..3: " 

cin >> guess; 

Switch (guess) { 
case 0: cout << "Not close"; break; 
case 1: cout << “Too low"; break; 
case 2: cout << "Right on"; break; 
case 3: cout << "Too high"; break; 
default: cout << "Illegal input"; 


} 
cout << endl; 
return 0; 

} 

6.5% 


35. 将 图 6-45 访问 结构 字段 的 C++ 程序 翻译 为 Pep/8 汇编 语言 ， 但 是 把 bi11 声明 为 main() 的 局 部 
变量 。 
36. 将 图 6-47 的 对 链表 进行 操作 的 C++ 程序 翻译 为 Pep/8 汇编 语言 ， 但 是 把 first、p Al value 声明 
为 全 局 变量 。 
37. 在 图 6-47 中 main() 的 return 语句 前 插入 下 面 的 C++ 代码 段 : 
sum = 0; p = first; 
while (p != 0) { 
sum += p->data; 
p = p->next; 
} 
cout << "Sum: " << sum << endl; 


将 整个 程序 翻译 为 Pep/8 汇编 语言 。 把 sum 和 其 他 局 部 变量 一 样 声明 如 下 : 


node *first, *p; 
int value, sum; 


38. 将 下 面 的 代码 段 插 人 到 图 6-47 中 node 的 声明 和 main() 之 间 : 


void reverse (node* list) { 
if (list != 0) { 
reverse (list->next); 
cout << list->data << " '; 


} 
把 下 面 的 代码 段 插 人 到 main) 中 return 语句 的 前 面 : 


cout << endl; 
reverse (first); 
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将 整个 程序 翻译 为 Pep/8 汇编 语言 。 增 加 的 代码 以 逆序 输出 链表 。 


39. 在 图 6-47 中 main() 的 return 语句 前 插入 下 面 的 代码 段 : 


40. 


4 


et 


first2 = 0; p% = 0; 
for (p = first; p != 0; p = p->next) { 
p2 = first2; 
first2 = new node; 
first2->data = p->data; 
first2->next = p2; 
} 
for (p2 = first2; p2 != 0; p2 = p2->next) { 
cout << p2->data << * * 
} 


把 first2 Al p2 与 其 他 局 部 变量 一 样 声 明 为 : 

node *first, *p. *first2, *p2: 

int value; 

将 整个 程序 翻译 为 Pep/8 汇编 语言 。 增 加 的 代码 生成 第 一 个 表 的 副本 ， 以 逆序 排列 并 输出 它 。 

(a) 写 一 个 C++ 程序 ， 把 一 个 无 序 整数 列 输入 到 一 个 二 又 搜索 树 ， 该 数列 用 -9999 作为 分 界 标识 
符号 ， 用 中 序 遍 历 树 输出 它们 。(b) 把 这 个 程序 翻译 为 Pep/8 汇编 语言 。 


. 这 道 题目 是 一 个 项 目 ， 用 C++ 写 出 Pep/8 计算 机 的 模拟 器 。( a) 写 出 一 个 装载 器 ， 以 标准 格式 的 


Pep/8 目标 文件 输入 ， 把 它 加 载 到 模拟 的 Pep/8 计算 机 的 内 存 中 。 把 主 存 声 明 为 一 个 整数 数组 ， 如 
下 所 示 : 
int Mem[65536]; // Pep/8 main memory 


把 从 标准 输入 来 的 一 个 字符 串 作 为 输入 。 写 出 一 个 内 存 转 储 (memory dump) 函数 ， 以 代表 该 程序 
的 十 进 制 整数 序列 的 形式 输出 主 存 的 内 容 。 例 如 ， 如 果 输 入 图 4-41 所 示 

51 00 07 51 00 08 00 48 69 zz 

那么 程序 应 该 把 十 六 进 制 数 转换 为 整数 ， 把 它们 存储 在 Mem 的 前 9 个 单元 中 。 输 出 就 应 该 是 如 下 
的 对 应 整数 值 : 

81 0 7 81080 72 105 | 

(b) 实现 指令 CHARO, DECO 和 STOP ， 寻 址 方式 为 立即 数 和 直接 寻 址 。 把 DEC0 指令 作为 原生 指令 
来 实现 ， 也 就 是 说 ， 不 要 实现 8.2 节 中 讲述 的 陷阱 机 制 。 使 用 图 4-31 帮助 你 实现 冯 “ 诺 依 曼 执行 
周期 。 例 如 ， 问 题 (a) 中 的 输入 对 应 的 输出 应 该 是 Hi 。 

(c) 实现 指令 BR、LDr、LDBYTEr、STr、STBYTEr、SUBSP 和 ADDSP ， 寻 址 方式 为 栈 相 对 寻 址 。 
用 Pep /8 汇编 句 汇 编 图 6-1 的 程序 ， 然 后 把 十 六 进 制 程序 输入 你 的 模拟 器 ， 以 此 来 检验 你 的 实现 。 
(d) 以 原生 指令 方式 实现 指令 DECI 和 STR0。 输 入 来 自 C++ 的 标准 输入 。 执 行 图 6-4 的 程序 来 检 
验 你 的 实现 。 

(e) 实现 条 件 跳 转 指令 BRLE、BRLT、BREQ、BRNE、BRGE、BRGT 和 BRV、 一 元 指令 NOTr 和 NEGr, 
以 及 比较 指令 cPr。 执 行 图 6-6、 图 6-8， 图 6-10、 图 6-12 和 图 6-14 的 程序 来 检验 你 的 实现 。 

(£) 实现 指令 CALL 和 RETn。 执 行 图 6-18、 图 6-21、 图 6-23 和 图 6-25 的 程序 来 检验 你 的 实现 。 
(g) 实现 指令 MOVSPA， 寻 址 方式 为 栈 相 对 间接 。 执 行 图 6-27 和 6-29 的 程序 来 检验 你 的 实现 。 

(h) 实现 指令 ASLr 和 ASRr ， 寻 址 方式 为 变 址 、 栈 变 址 和 栈 变 址 间接 。 执 行 图 6-34、 图 6-36、 
图 6-38、 图 6-40 和 图 6-47 的 程序 来 检验 你 的 实现 。 

(i) 实现 间接 寻 址 模式 。 执 行 图 6-41 的 程序 来 检验 你 的 实现 。 
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现在 ， 你 也 是 使 用 多 语种 的 人 了 ， 因 为 你 至 少 懂得 4 种 语言 了 一 一 汉语 、C++、Pep/8 
汇编 语言 和 机 咒语 言 。 汉 语 是 自然 语言 ， 而 其 他 3 种 是 人 工 语 言 。 

要 记 住 这 一 点 。 下 面 让 我 们 先 转 到 计算 机 科学 的 基本 问题 ， 即 “什么 能 够 被 自动 化 ?” 
我 们 用 计算 机 来 自动 化 所 有 的 事情 ， 从 写 工资 支票 到 纠正 文稿 中 的 拼写 错误 。 尽 管 计算 机 在 
日 然 语 言 翻译 上 还 不 算 很 成 功 ， 比 如 从 德语 翻译 到 英语 ， 但 在 翻译 人 工 语言 方面 ， 它 已 经 非 
常 成 功 了 。 我 们 已 经 学 习 了 如 何 对 3 种 人 工 语言 C++、Pep/8 汇编 语言 和 机 器 语言 互相 转换 
进行 翻译 。 编 译 占 和 汇编 髓 自动 化 了 这 些 人 工 语言 之 间 的 翻译 过 程 。 

因为 计算 机 系统 的 每 一 层 都 有 自己 的 人 工 语言 ， 所 以 这 些 语言 之 间 的 自动 翻译 是 计算 机 
科学 的 核心 。 计 算 机 科学 家 已 经 提出 了 非常 丰富 的 人 工 语 言及 其 自动 翻译 过 程 的 理论 ， 本 章 
的 内 容 就 是 介绍 这 一 理论 ， 并 展示 它 怎样 应 运 于 从 C++ 到 Pep/8 汇编 语言 的 翻译 。 

语法 和 语义 是 人 工 语言 的 两 个 属性 。 计 算 机 语言 的 语法 (syntax) 是 一 个 程序 要 成 为 合 
法 的 语言 程序 必须 要 遵守 的 一 套 规则 。 语 义 ( semantics) 是 合法 程序 背后 的 含义 或 逻辑 。 在 
操作 上 ， 翻 译 右 程序 可 以 成 功 地 翻译 语法 正确 的 程序 。 语 言 的 语义 决定 目标 程序 执行 时 ， 翻 
译 后 程序 产生 的 结果 。 

自动 翻译 器 中 比较 源 程序 和 语言 语法 的 部 分 叫 作 分 析 器 ( parser)。 给 源 程序 指定 含义 的 
部 分 叫 作 代码 生成 器 (code generator)。 大 多 数 计算 机 科学 理论 应 用 于 翻译 过 程 的 语法 部 分 
而 不 是 语义 部 分 。 

这 里 是 描述 语言 语法 的 3 种 和 用 技术 : 

© 语法 

e 有 限 状 态 机 

e 正则 表达 式 

本 章 介绍 语法 和 有 限 状 态 机 ， 展 示 怎 样 构建 软件 有 限 状 态 机 来 帮助 语法 分 析 过 程 。 最 后 
一 节 讲 述 了 一 个 完整 的 程序 ， 包 括 代 码 生 成 ， 它 实现 了 两 种 语言 之 间 的 自动 翻译 。 由 于 篇 幅 
限制 ， 本 章 没 有 对 正则 表达 式 进 行 讲 解 。 


7.1 语言 、 语 法 和 语法 分 析 


每 种 语言 都 有 它 的 字符 表 。 从 形式 上 来 说 ， 每 个 字符 表 都 是 一 组 有 限 、 非 空 的 字符 。 例 
ON, C++ 的 字符 表 是 非 空 集合 


ian ff G&G Ga hw wh & ER lH N 
tr Cris & wm LULANTA OB 
oh & Fy & H wa em & Mm He RD P 
i. Be o Ty 4 WhO am YY & G4, g 2 
‘4 & & F & & & S& MH HR GS A HT 
Be f° 3 Gy i &  & * 
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ax Ne E He Ie 
Pep/8 汇编 语言 的 的 字符 表 除 了 标点 符号 之 外 其 他 是 一 样 的 ， 如 下 所 示 : 


| a Ge & d, e, f. So t& % d& Km le Mm & 
“pm orn FS & @BVM WM BM BZ Be B, 
GC i & Fo & Hh hh & & Mm & G *B, 
aR & TF & Mh GD] B&B & Te 3 
A & & h B&B WB : ae 


_ 个 字符 表 的 例子 是 实数 语言 的 字符 表 ， 不 是 科学 计数 法 表示 的 实数 。 它 的 字符 表 集 


7.1.1 连接 


抽象 数据 类 型 是 一 个 可 能 值 的 集合 和 一 组 作用 于 这 些 值 的 运算 。 注 意 ， 字 符 表 就 是 值 的 
集合 。 值 的 集合 上 的 一 种 运算 叫 连 接 ( concatenation )， 它 简单 地 连接 两 个 或 者 更 多 的 字符 成 
为 字符 串 。C++ 字符 表 中 的 一 个 例子 是 把 ! 和 = 连接 成 为 字符 串 !=。 在 Pep/8 汇编 字符 表 
中 ， 可 以 把 d 和 大 连接 成 为 d#， 在 实数 语言 中 ， 可 以 把 -、2、3、. 和 7 连接 成 为 -23.7。 

连接 不 仅 适 用 于 字符 表 中 单个 字符 构成 字符 串 ， 也 适用 于 用 字符 串 构 成 更 大 的 字符 串 。 
从 C++ 字符 表 ， 可 以 连接 void、printBar 和 (int n) 来 生成 过 程 头 


void printBar (int n) 


字符 串 的 长 度 是 字符 串 中 字符 的 个 数 。 字 符 串 void 的 长 度 是 4。 长 度 为 0 的 字符 串 叫 
空 字符 串 ， 用 希腊 字母 s 表示 ， 区 别 于 字母 表 中 的 英语 字符 。 它 有 这 样 的 连接 性 质 
ex=xe =x 
这 里 x 是 一 个 字符 串 。 空 字符 串 对 描述 语法 规则 非常 有 用 。 
在 数学 术语 中 ，s 是 连接 运算 的 单位 元 。 一 般 来 说 ， 一 个 运算 的 单位 元 (identity 
element) i， 在 作用 于 一 个 值 x 时 ， 不 会 改变 x 的 值 。 
例 7.1 1 是 乘法 运算 的 单位 元 ， 因 为 
1]."X 一 X。]1 王 x 
true 是 AND 运算 的 单位 元 ， 因 为 
true AND q = q AND true = q LJ 


7.1.2 语言 


如 果 了 7 了 是 一 个 字符 表 , T 的 闭 包 表示 为 7 ， 它 是 通过 连接 了 中 的 元 素 可 能 形成 的 所 有 
字符 串 的 集合 。7" 是 非常 大 的 。 例 如 ， 如 果 了 是 英语 字符 表 中 字符 和 标点 符号 的 集合 ， 那 
L T 会 包括 所 有 莎士比亚 著作 、 英 文 圣经 和 所 有 曾经 出 版 的 英文 百科 全 书 的 句子 ， 还 包括 
全 世界 历史 上 所 有 图 书馆 曾经 用 这 些 字符 印刷 的 所 有 字符 串 。 

它 不 仅 包 括 有 意义 的 字符 串 ， 也 包 插 无 意义 的 字符 串 。 这 里 是 英语 字符 表 7 的 一 
元 素 : 

To be or not to be，that is the question. 

Go fly a kite. 


224 PORD LHA(FISZ) 


Here over highly toward? 

alkeu jfoj ,9nm20mfq23jk 1?x!jeo 

当 了 是 实数 语言 的 字符 表 时 ，7 ”的 一 些 元 素 可 以 是 : 
一 2894.01 


你 可 以 很 容易 的 构建 刚才 提 到 的 两 个 字符 表 的 7” 的 很 多 其 他 元 素 。 因 为 字符 串 可 以 无 
限 长 ， 所 以 任何 字符 表 的 闭 包 中 元 素 个 数 是 无 限 的 。 

什么 是 语言 呢 ? 在 前 面 讲 述 的 7 例子 中 ， 一些 字 符 串 是 语言 ,一些 不 是 。 在 英语 的 例 
子 中 ， 前 两 个 字符 串 是 有 效 的 英语 句子 ， 即 它们 是 语言 。 后 两 个 不 是 语言 。 语 言 (language) 
是 它 字 符 表 闭 包 的 子 集 。 可 以 用 字符 表 中 的 字符 组 成 的 字符 串通 过 连接 构建 无 限 多 的 字符 
串 ， 但 是 其 中 只 有 一 些 包含 在 语言 中 。 

例 7.2 思考 下 面 7 中 的 两 个 元 素 ， 这 里 了 是 C++ 语言 字符 表 : 


#include <iostream> 
int main() { 
cout << "Valid"; 
return 0; 


} 


#include <iostream> 
int main(); { | 
eout. << "Valid": 


return 0; 
} 
T ”的 第 一 个 元 素 是 C++ 语言 ， 但 第 二 不 是 ， 因 为 它 有 一 个 语法 错误 。 口 
7.1.3 语法 


要 定义 一 种 语言 ， 需 要 一 种 方式 能 够 说 明 T 中 哪些 元 素 是 语言 ， 哪 些 不 是 。 语 法 
(grammar) 就 是 这 样 一 种 系统 ， 它 指明 可 以 怎样 连结 字符 表 了 的 字符 形成 一 种 对 该 语言 来 说 
合法 的 字符 串 。 形 式 上 ， 语 法 包含 4 个 部 分 : 

e N, 一 个 非 终 结 字符 表 。 

e 7 了 7， 一 个 终结 字符 表 。 

e P, 一 套 产生 式 规 则 。 

e 939， 初始 符 ， 为 N 的 一 个 元 素 。 

非 终 结 字 符 表 的 一 个 元 素 代 表 终 结 字 符 表 了 的 一 组 字符 。 非 终结 符号 通常 用 <> 括 起 
来 。 当 阅读 语言 时 ， 看 到 的 是 终结 符 。 产 生 式 规则 使 用 非 终 结 符 来 描述 语言 的 结构 ， 这 可 能 
不 像 阅读 语言 那么 明显 。 

例 7.3 C++ 语 法 中 ， 非 终结 符 <compound-statement> (< 复合 语句 >) 可 能 代表 下 面 一 
组 终结 符 : 

{ 

THE Ts 
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i++; 


cout << i; 
} 


C++ 程序 的 代码 始终 是 包含 终结 符 而 绝 不 会 包含 非 终结 符 。 我 们 肯定 不 会 看 到 这 样 的 
C++ 代码 
fHinclude <iostream> 


main() 
<compound-statement> 


非 终结 符 <compound-statement > 用 于 描述 C++ 程序 的 结构 。 口 

每 种 语法 都 有 一 个 特殊 的 非 终 结 符 ， 叫 作 初 始 符 (start symbol), S。 注 意 N 是 一 个 集合 ， 
(ASAE, 是 集合 NN 的 一 个 元 素 。 初 始 符 和 产生 式 规 则 ,，P 一 起 ， 使 我 们 能 确定 一 个 由 终 
结 符 组 成 的 字符 串 是 否 是 该 语言 的 一 个 合法 句子 。 如 果 从 5S 开始 用 产生 式 规则 能 产生 该 终结 
符 组 成 的 字符 串 ， 那 么 该 字符 串 就 是 一 个 合法 的 句子 。 


7.1.4 C++ 标识 符 的 语法 


图 7-1 中 的 语法 定义 了 C++ 标识 符 。 尽 管 C++ 标识 符 可 以 使 用 任意 的 大 写 或 小 写字 母 
或 者 数字 ， 但 是 为 了 使 例子 简短 ， 这 个 语法 仅 多 许字 母 N = {<identifier>, <letter>, <digit>} 
a、b、c 和 数字 1、2、3。 这 样 的 简化 仍然 能 够 使 我 们 | T= (a. b, c. 1, 2, 3) 
了 解构 成 标识 符 的 规则 。 第 一 个 字符 必须 是 字母 ， 如 果 | Po eters 


有 的 话 ， 剩 下 的 字符 可 以 是 字母 或 数字 的 任意 组 合 。 ee 
这 个 语法 有 3 个 非 终结 符 ， 即 <identifier> (< 标识 "i ponai See cage 
a), setae CE eae EE) BM | ee 
符 是 <identifier>， 它 是 非 终 结 符 集合 中 的 一 个 元 素 。 7. <digit> > 1 
产生 式 规 则 的 形式 是 eas re 


9. <digit> 一 3 
Aw = <identifier> 


XE AERA, w 是 终结 符 和 非 终 结 组 成 的 字符 串 。 图 7-1 C++ 标识 符 的 语法 
符号 一 表示 “产生 ”。 图 7-1 中 的 产生 式 规则 3 读 作 “ 标 
识 符 产 生 后 面 带 数字 的 标识 符 ”。 

语法 通过 称 为 推导 ( derivation) 的 过 程 来 指定 语言 。 为 了 推导 一 个 合法 的 语言 句子 ， 从 
初始 符 开始 ， 根 据 产 生 式 规则 不 断 替 代 非 终结 符 , 直到 得 到 由 终结 符 组 成 的 字符 串 。 下 面 是 
根据 语法 推导 出 标识 符 cab3 的 情况 ,符号 之 表示 一 步 推导 ”: 


<identifier> =><identifier><digit> 规则 3 
=><identifier> 3 规则 9 
=><identifier><letter> 3 规则 2 
=><identifier> b 3 规则 5 
=><identifier><letter> b 3 规则 2 
=><identifier> a b 3 规则 4 
=><letter> ab 3 规则 1 
=>cab3 规则 6 


每 一 步 推导 的 后 面 是 依据 这 个 替换 的 产生 式 规则 。 例 如 ， 规 则 2 


<identifier> — <identifier><letter> 
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用 于 和 蔡 换 推导 步骤 

<identifier> 3 =><identifier><letter> 3 
中 的 <identifier>。 应 该 把 这 步 推导 读 作 “ identifier 后 面 跟着 3 一 步 推导 为 identifier 后 面 跟 
着 字母 ， 字 母后 面 跟着 3”。 

推导 运算 的 财 包 类 似 于 字符 表 的 财 包 运 算 ， 符 号 之 * 表示 “经 过 零 步 或 多 步 推 导 "， 可 
以 把 前 面 8 步 推导 概括 为 : 

<identifier> =>*c a b 3 
这 个 推导 证 明 cab3 是 一 个 合法 的 标识 符 ， 因 为 它 能 够 从 初始 符 <identifier> 推导 出 来 。 一 
个 语法 定义 的 语言 是 由 使 用 产生 式 规则 可 以 从 初始 符 推 导出 的 所 有 字符 串 组 成 的 。 语 法 提供 
了 判定 是 否 属于 一 个 语言 的 测试 规则 ， 如 果 是 不 能 被 推导 出 来 的 字符 串 ， 那 么 就 不 属于 该 


Wee 
7.15 有 符号 整数 的 语法 


图 7-2 中 的 语法 定义 了 有 符号 整数 的 语言 ，d 代表 一 个 十 进 制 数 字 。 初 始 符 1 代表 整数 ， 
F 是 第 一 个 字符 ， 可 以 是 任意 符号 ，M 表示 大 小 。 op 
有 时 候 为 了 节省 页 面 空间 ， 产 生 式 规则 没有 编号 ， 放 在 一 行 | lf 





上 。 这 个 语法 的 产生 式 规 则 可 以 写成 这 样 P= Be pokoi 
I> 
L= PM 2.F 3+ 
F—>+|-|e 3. F >- 
4. 上 一 8 
M > d | aM 5. M 一 dM 
这 里 的 竖 线 | 是 间隔 运算 符 ， 读 作 “ 或 "。 最 后 一 行 读 作 “M 产 生 | | OM 
d, 或 者 d 后 面 跟 M”。 
> _ 
下 面 是 这 个 语法 的 一 些 合 法 有 符号 整数 的 推导 : 图 7-2 有 符号 整数 的 语法 
I => FM I => FM I > FM 
=> FdM => FdM => FdM 
=> FddM => Fdd = FddM 
= Fddd => dd = FdddM 
=> =ddd = Fdddd 


= +dddd 


注意 第 二 个 推导 的 最 后 一 步 怎样 用 空 字 符 串 从 Fdd 推导 出 dd， 它 使 用 了 产生 式 F 一 e 
Aled = d 的 事实 。 这 种 市 空 字 符 串 的 产生 式 规则 能 很 方便 地 表达 大 小 前 面 的 正 号 或 负 号 是 
可 选 的 。 

ddd+ 、+-ddd 和 ddd+dd 都 是 这 种 语法 的 非法 字符 串 。 试 着 用 语法 推导 这 些 字符 串 来 
确认 它们 不 属于 该 语言 。 你 能 根据 产生 式 规 则 证 明 这 几 个 字符 串 不 属于 该 语言 吗 ? 

这 两 个 语法 示例 中 的 产生 式 都 有 递归 规则 ， 用 非 终结 符 来 定义 它 上 自己 。 图 7-1 中 规则 3 
根据 <identifier> 定义 <identifier>， 如 下 所 示 。 

<identifier> 一 <identifier><digit> 

图 7-2 中 规则 5 根据 M 定义 M， 如 下 所 示 。 

M > dM 
递归 规则 产生 的 语言 具有 无 穷 多 合法 的 句子 。 要 推导 出 一 个 具有 任意 长 度 的 标识 符 ， 只 要 一 
直 将 <identifier> 替换 成 <identifier><digit> 即 可 。 
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与 所 有 的 递归 定义 一 样 ， 必 须 有 一 个 安全 出 口 作为 定义 的 基础 ， 否 则 对 非 终 结 符 的 替换 
就 不 会 停 下 来 。 图 7-2 中 M 一 d 的 规则 给 M 的 递归 提供 了 基础 。 


7.1.6 ”上下文 相关 的 语法 


前 面 讲 到 的 语法 的 产生 式 规则 都 是 左边 是 单个 的 非 终结 符 。 图 7-3 中 的 语法 有 一 些 左边 
既 有 非 终结 符 又 有 终结 符 的 产生 式 规 则 。 
这 是 一 个 使 用 该 语法 的 终结 字符 串 推 导 : 





A > aABC 规则 1 the productions 

1. A => aABC 

=> aaABCBC 规则 1 7. A =y abe 

=> aaabCBCBC 规则 2 3. CB 一 BC 
4. bB 一 bb 

之 aaabBCCBC 规则 3 i 

=> aaabBCBCC 规则 3 = a CC 

= aaabBBCCC 规则 3 

之 aaabbBCCC 规则 4 图 7-3 上 下 文 相关 语法 

=> aaabbbCCC 规则 4 

> aaabbbcCC 规则 5 

之 aaabbbccC 规则 6 

之 aaabbbccc 规则 6 


这 个 推导 中 一 个 替换 的 例子 是 在 步 双 aaabbbCCC => aaabbbcCC 使 用 了 规则 5， 规 则 
5 允许 用 c 替换 C， 但 是 只 有 当 C 的 左边 有 b 的 时 候 才 行 。 

在 英语 中 ， 断 章 取 义 是 指 不 考虑 一 句 话 周围 的 语句 而 引用 它 。 规 则 5 就 是 一 个 上 下 文 相 
关 规 则 的 例子 ， 它 不 允许 用 c 替换 C， 除 非 C 有 适当 的 上 下 文 ， 即 它 正 好 在 一 个 b 的 右边 。 

不 严格 地 说 ， 上 下 文 相 关 语 法 ( context-sensitive grammar) 的 产生 式 规 则 左边 可 以 包含 
多 于 一 个 的 非 终 结 符 。 与 之 相 比 ， 每 个 产生 式 规则 左边 只 有 一 个 非 终 结 符 的 语法 ， 称 为 上 下 
LAK (context-free) 语法 。( 上下文 相关 和 上 下 文 无 关 语 法 的 准确 理论 定义 要 比 这 些 定义 更 
为 严格 。 为 简单 ， 本 章 使 用 前 面 的 这 种 定义 ,不 过 我 们 应 该 知道 该 理论 更 严格 的 描述 并 不 像 
我 们 定义 的 那样 简单 ) 

abc、aabbcc 和 aaaabbbbcccc 是 这 种 语法 描述 语言 的 一 些 合法 字符 串 的 例子 。 而 
aabc 和 cba 是 非法 字符 串 的 例子 。 可 以 试 着 推导 出 这 些 合法 字符 串 ， 也 可 以 尝试 推导 这 些 
非法 字符 串 以 证 明 它 们 是 不 合法 的 。 用 这 些 规则 做 一 些 练习 ， 你 应 该 能 了 解 这 种 语言 是 以 一 
个 或 多 个 a 开始， 后 面 跟 同 样 数量 的 b， 后 面 再 跟 同 样 数量 的 c 的 字符 串 集合 。 这 种 语言 也 
用 数学 语言 来 表达 为 

L = {a"b"c" |n>0} 
读 作 “语言 工 是 字符 串 ab" 的 集合 ,，n 大 于 0”。 符 号 a" 表示 n 个 a 的 连接 。 
7.1.7 语法 分 析 问 题 

从 语法 推导 出 合法 字符 串 是 非常 简单 明了 的 。 可 以 在 当前 中 间 字 符 串 的 右边 任意 选择 一 
些 非 终结 符 ， 反 复 选 择 规则 进行 替换 ， 直 到 得 到 一 个 终结 符 字 符 串 。 这 样 的 随机 推导 可 以 得 
到 该 语言 的 许多 字符 串 。 

然而 ， 上 自动 翻译 器 是 一 项 更 难 的 任务 。 给 翻译 器 一 个 终结 符 字 符 串 ， 假 设 是 某 个 人 工 语 
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言 的 合法 句子 。 在 翻译 器 生成 目标 代码 前 ， 它 必须 确定 终结 符 字 符 串 是 否 确 实 是 合法 的 。 确 
定 字 符 串 是 否 合法 的 唯一 办 法 是 从 语法 的 初 
始 符 推 导出 它 。 翻 译 器 必须 尝试 进行 这 样 的 a) 推导 出 合法 的 句子 

推导 ， 如 果 推 导 成 功 了 就 知道 这 个 字符 串 是 


一 个 合法 的 句子 。 确 定 一 个 给 定 的 终结 符 字 
符 串 是 否 是 特定 语法 的 合法 句子 的 问题 叫 作 LE 不 合法 


语法 分 析 (parsing)， 如 图 7-4 所 示 。 b) 语法 分 析 癌 是 
对 给 定 的 句子 进行 语法 分 析 要 比 推导 任 图 7-4 推导 出 任意 一 个 句子 与 分 析 一 个 给 定 的 
意 的 合法 字符 串 更 难 。 语 法 分 析 问 题 就 是 某 名 于 之 间 的 区 别 


种 形式 的 搜索 。 分 析 算法 必须 搜索 出 正确 的 替换 序列 ， 推 导出 给 定 的 字符 串 。 如 果 给 定 的 字 
符 串 是 合法 的 ， 它 不 仅 要 找到 这 个 推导 ， 如 果 给 定 的 字符 串 不 是 合法 的 ， 它 也 必须 能 够 发 
现 。 如 果 你 在 房间 里 寻找 一 枚 销 石 戒指 ， 但 是 找 不 到 ， 并 不 表示 戒指 不 在 你 的 房间 里 。 可 能 只 
是 你 没 找到 对 的 地 方 。 类 似 地 ， 如 果 试 图 找到 给 定 字 符 串 的 推导 ,但 是 找 不 到 ， 你 怎么 知道 推 
导 不 存在 呢 ? 翻 译 右 必须 能 够 证 明 如 果 给 定 的 字符 串 是 非法 的 ， 一定 不 存在 对 应 的 推导 。 


7.1.8 表达 式 的 语法 


为 了 了 解 语 法 分 析 促 可 能 遇 到 的 困难 ， 考 虑 图 7-5， 它 给 出 了 描述 算术 表达 式 的 语法 。 
假设 给 定 的 终结 符 字 符 串 为 


(a*a)+a 





给 定 该 语法 的 产生 式 规 则 ， 要 求 对 给 定 的 字符 串 进行 a al 
分 析 。 正确 的 语法 分 析 是 : P = tha don 
ESE+T 规则 | lI.E E+I 

PSF 规则 4 eie 
= 规则 5 5.F (EB) 
>(T)+T 规则 2 6 P34 
=>(T*F)+T 规则 3 S=E 
> ( F*F)+T 规则 4 
ee eee eee 图 7-5 表达 式 的 语法 。 非 终结 符 E 表示 
>(ata)+T 规则 6 一 个 表达 式 。T 表示 一 个 术语 
>(a*a)+F 规则 4 ia a 
—>(a*ada)++a 规则 6 而 F 表示 该 表达 式 的 一 个 因子 


语法 分 析 困 难 的 原因 是 可 能 在 前 面 的 分 析 中 就 做 出 了 错误 的 决定 ， 虽 然 在 当时 看 上 去 是 
可 行 的 ,但 是 会 导致 进入 死路 。 例 如 ， 看 见 给 定 的 字符 串 里 有 “(”， 就 立即 选择 规则 5。 你 
可 能 会 答 试 这 样 进 行 分 析 


E=>T 规则 2 
=> F 规则 4 
一 时 二 S 规则 5 
{TF ) 规则 2 


=>(T*F) 规则 3 
>(F*F) 规则 4 
二 (a*F) 规则 6 
>(a*a) 规则 6 


到 目前 为 止 ， 看 上 去 是 在 朝 着 分 析 该 表达 式 的 目标 上 前 进 ， 因 为 随 着 推导 的 每 一 步 ， 中 
间 字 符 串 看 上 去 都 更 像 原 始 的 字符 串 了 。 不 幸 的 是 ， 却 陷 人 了 困境 ， 因 为 没有 办 法 推导 出 原 
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始 字 符 串 中 的 +。 
在 到 达 这 个 死胡同 之 后 ， 我 们 可 能 会 得 出 结论 : 该 给 定 的 字符 串 是 非法 的 ， 但 是 这 是 错 
的 。 因 为 找 不 到 一 个 推导 并 不 意味 着 这 样 的 推导 不 存在 。 
语法 分 析 有 趣 的 一 面 是 它 可 以 表示 为 一 棵 树 。 初 始 符 是 树 根 。 树 的 每 个 内 部 结 点 是 一 个 
非 终 结 符 ， 每 个 叶子 结 点 是 一 个 终结 符 。 内 部 结 点 的 孩子 是 在 推导 中 用 来 替换 父亲 结 点 的 产 
生 式 规则 右边 部 分 的 符号 。 这 种 树 称 为 语法 树 ， 原因 显而易见 。 图 7-6 给 出 了 采用 图 7-5 所 
示 语 法 的 (a*a )+a 的 语法 树 。 图 7-7 给 出 了 采用 图 7-2 中 语法 的 dd 的 语法 树 。 


E 


十 


p — de 


a 
n 


> 


| 
d 
图 7-6 按照 图 7-5 对 (ax*a )+a 进行 分 析 的 语法 树 图 7-7 按照 图 7-2 对 dd 进行 分 析 的 语法 树 


7.1.9 C++ 语法 的 一 部 分 


图 7-8 中 语法 的 产生 式 规 则 是 C++ 语言 的 一 小 部 分 。 这 种 语言 的 基本 数据 类 型 只 有 整 
数 和 字符 ， 不 提供 常量 或 类 型 定义 ,不 允许 引用 参数 ， 还 省 略 了 switch 和 for 语句。 尽管 
有 诸多 限制 ,但 是 它 仍然 给 出 了 如 何 形式 化 定义 一 个 真实 语言 语法 的 大 致 思路 。 


<translation-unit> — 
<external-declaration> 
| <translation-unit> <external-declaration> 


<external-declaration> 一 
<function-definition> 
| <declaration> 


<function-definition> > 
<type-specifier> <identifier> ( <parameter-list> ) <compound-statement> 
|<identifier> ( <parameter-list> ) <compound-statement> 


<declaration> — <type-specifier> <declarator-list> ; 


<type-specifier> 一 void | char | int 


<declarator-list> 一 
<identifier> 
| <declarator-list> , <identifier> 


<parameter-list> 一 
E€ 
| <parameter-declaration> 
| <parameter-list> , <parameter-declaration> 


图 7-8 C++ 语言 的 一 部 分 语法 
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<parameter-declaration> 一 <type-specifier> <identifier> 
<compound-statement> 一 { <declaration-list> <statement-list> } 


<declaration-list> 一 
e 
| <declaration> 
| <declaration-list> <declaration> 


<statement-list> 一 
€ 
| <statement> 
| <statement-list> <statement> 


<statement> 一 
<compound-statement> 
| <expression-statement> 
| <selection-statement> 
| <iteration-statement> 


<expression-statement> 一 <expression> ; 


<selection-statement> 一 
if ( <expression> ) <statement> 
| if ( <expression> ) <statement> else <statement> 


<iteration-statement> 一 
while ( <expression> ) <statement> 
| do <statement> while ( <expression> ) ; 


<expression> 一 
<relational-expression> 
| <identifier> = <expression> 
<relational-expression> 一 
<additive-expression> 
| <relational-expression> < <additive-expression> 
| <relational-expression> > <additive-expression> 
| <relational-expression> <= <additive-expression> 
| <relational-expression> >= <additive-expression> 


<additive-expression> 一 
<multiplicative-expression> 
| <additive-expression> + <multiplicative-expression> 
| <additive-expression> - <multiplicative-expression> 


<multiplicative-expression> 一 
<unary-expression> 
| <multiplicative-expression> * <unary-expression> 
| <multiplicative-expression> / <unary-expression> 


<unary-expression> 一 
<primary-expression> 
| <identifier> ( <argument-expression-list> ) 


<primary-expression> 一 
<identifier> 
| <constant> 
| ( <expression> ) 


<argument-expression-list> 一 
<expression> 
| <argument-expression-list> , <expression> 


<constant> 一 
<integer-constant> 
| <character-constant> 





图 7-8 (2£) 
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<integer-constant> 一 
<digit> 
| <integer-constant> <digit> 


<character-constant> — ' <letter> ' 


<identifier> 一 
<letter> 
| <identifier> <letter> 
| <identifier> <digit> 


<letter> 一 
alblcldlelflglhnliljlkl1lm| 
n|olplqlrlsltlulvlwlxlylz| 
AIBICJDJE]FIGJH]IJJ|KI{LIM| 
NIolPplalRlSITIUIVIWIXxIYIz 


<digit> 一 
0|1|2131415|16171819 


图 7-8 (2) 


该 语法 的 非 终 结 符 用 尖 括 号 <> 括 起 来 。 任 何 没有 用 尖 括 号 括 起 来 的 符号 是 终结 字符 ， 
可 以 出 现在 C++ 程序 代码 中 。 该 语法 的 初始 符 是 非 终 结 符 <translation-unit>(< 翻译 单元 >)。 
用 语法 的 产生 式 规则 来 描述 编程 语言 的 方法 称 为 巴 科斯 范式 《Backus Naur Form, BNF), 在 
BNF 中 ,产生 式 符号 一 有 时 写作 ::=。 设 计 于 1960 年 的 语言 GLGOL-60 使 得 BNF 流行 了 起 来 。 
下 面 这 个 示例 是 该 语法 的 分 析 ， 表 明 如 果 S1 是 一 个 合法 的 <statement> (< 语句 >), ABA 


while (a <= 9) 





SJ; 
也 是 合法 的 <statement>。 该 语法 分 析 由 下 述 推导 组 成 : 
<statement> 
=> <iteration-statement> 
=> while ( <expression> ) <statement> 
=> while ( <relational-expression> ) <statement> 
= while ( <relational-expression> <= <additive-expression> ) <statement> 
=> while ( <additive-expression> <= <additive-expression> ) <statement> 
= while ( <multiplicative-expression> <= <additive-expression> ) <statement> 
=> while ( <unary-expression> <= <additive-expression> ) <statement> 
=> while ( <primary-expression> <= <additive-expression> ) <statement> 
=> while ( <identifier> <= <additive-expression> ) <statement> 
=> while ( <letter> <= <additive-expression> ) <statement> 
=> while (a <= <additive-expression> ) <statement> 
=> while ( a <= <multiplicative-expression> ) <statement> 
=> while (a <= <unary-expression> ) <statement> 
=> while (a <= <primary-expression> ) <statement> 
= while (a <= <constant> ) <statement> 
=> while (a <= <integer-constant> ) <statement> 
=> while (a <= <digit> ) <statement> 
=> while (a <= 9 ) <statement> 
=> while (a <= 9 ) <expression-statement> 
=> while (a <= 9 ) <expression> ; 
=>*while (a <= 9 )S/; 


图 7-9 给 出 了 这 个 分 析 对 应 的 语法 树 。 非 终结 符 <statement> 是 树 根 ， 因 为 这 个 分 析 的 
目的 是 要 证 明 该 字符 串 是 一 个 合法 的 <statement>。 
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<statement> 
<iteration—statement> 
while ( <expression> ) <statement> 


<relational—expression> . 
P <expression—statement> 


<relational—expression> <= <additive—expression> 
<expression> 
<additive—expression> <multiplicative—expression> S1 
<multiplicative—expression> <unary—expression> 
<unary—expression> <primary—expression> 
<primary—expression> <constant> 
<identifier> <integer-eonstant> 
<letter> <digit> 
a 9 
图 7-9 图 7-8 中 
while a<=9 
SLs 
的 语句 分 析 的 语法 树 


记 住 这 个 例子 ， 思考 C++ 编译 器 的 任务 。 将 编译 器 编写 为 包含 一 组 产生 式 规 则 ， 类 
似 于 图 7-8 那样 的 规则 。 程 序 员 向 编译 器 提交 一 个 包含 源 程序 的 文本 文件 ， 就 是 一 个 长 长 
的 终结 符 字 符 串 。 首 先 ， 编 译 器 必须 确定 这 个 终结 符 字 符 串 表示 的 是 不 是 一 个 合法 的 C++ 
<translation-unit>。 如 果 是 ， 那 么 编译 器 就 必须 生成 相应 的 低级 语言 表示 的 目标 代码 。 如 果 
不 是 ， 编 译 器 必须 产生 适当 的 语法 错误 提示 。 

标准 C++ 语法 中 有 上 百 条 产生 式 规 则 。 想 象 C++ 编译 器 的 工作 量 吧 ! 每 次 提交 程序 
时 ， 它 都 要 在 这 些 产 生 式 规则 中 排序 遍历 。 幸 运 的 是 ， 计 算 机 理论 发 展 至 今 已 经 能 够 使 编译 
器 的 语法 分 析 不 太 困 难 。 使 用 当前 理论 设计 出 的 C++ 编译 器 保证 在 程序 分 析 中 推导 的 每 一 
步 蔡 换 都 能 够 选择 正确 的 产生 式 。 如 果 分 析 算 法 不 能 找到 匹配 源 程序 的 <translation-unit> 的 
推导 ， 就 能 够 证 明 这 样 的 推导 是 不 存在 的 ， 提 交 的 源 程序 一 定 有 语法 错误 。 

对 编译 器 来 说 ， 代 码 生 成 比 语法 分 析 更 难 一 些 。 究 其 原因 是 目标 代码 必须 运行 在 某 个 制造 
厂商 生产 的 某 种 特定 的 机 器 上 。 因 为 每 个 厂商 的 机 器 架构 都 不 同 ， 指 令 集 也 不 同 ， 所 以 一 种 机 
右 的 代码 生成 技术 可 能 不 适用 于 男 一 种 机 器 。 不 存在 一 种 单一 标准 的 基于 理论 概念 的 冯 … 诺 依 
曼 架 构 。 这 就 导致 没有 出 现 太 多 关于 代码 生成 的 理论 能 够 指导 编译 器 设计 者 构建 编译 器 。 


7.1.10 C++ 的 上 下 文 相 关 性 


从 图 7-8 来 看 C++ 语言 狐 似 是 上 下 文 无 关 的 。 每 个 产生 式 规则 的 左边 都 只 有 一 个 非 终 
结 符 。 这 与 图 7-3 所 示 的 上 下 文 有 关 语 法 是 不 同 的 ， 上 下 文 无 关 语 法 中 允许 产生 式 左 边 有 多 
于 一 个 的 非 终结 符 。 外 表 看 上 去 是 很 有 欺骗 性 的 。 虽 然 C++ 语法 的 这 个 子 集 和 完整 的 C++ 
语言 标准 都 是 上 下 文 无 关 的 ， 但 是 C++ 语言 本 身 的 某 些 方面 是 上 下 文 相关 的 。 
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来 看 一 看 图 7-3 中 的 语法 。 它 的 产生 式 规则 怎么 保证 字符 串 结尾 的 c 的 个 数 必须 等 于 开 
Ka 的 个 数 ? 规则 1 和 2 保证 每 生成 一 个 a， 都 会 生成 一 个 C。 规 则 3 让 C 交换 到 B 的 右 
边 。 最 后 ， 规 则 5 允许 在 C 的 左边 有 b 的 情况 下 ， 用 c 替代 C。 没 有 办 法 用 上 下 文 无 关 语 
法 描述 这 个 语言 ， 因 为 它 需 要 规则 3 和 5 让 C 到 字符 串 的 末尾 。 

C++ 语言 有 上 下 文 相 关 的 一 面 ， 这 在 图 7-8 中 没有 表现 出 来 。 例 如 ，<parameter-list> 
(< 形 参 列表 >) 的 定义 允许 任意 数量 的 形 参 ， 而 <argument-expression-list> (< 实 参 表 达 式 
列表 >) 的 定义 允许 任意 数量 的 实 参 。 可 以 写 一 个 C++ 程序 包含 一 个 具有 3 个 形 参 的 过 程 ， 
以 及 一 个 有 2 个 实 参 的 过 程 调 用 ， 图 7-8 中 的 语法 可 以 从 <translation-unit> 推导 出 来 。 但 是 
如 果 想 编译 这 个 程序 ， 编 译 希 会 报 一 个 语法 错误 。 

C++ 中 形 参 的 数量 必须 等 于 实 参 的 数量 ， 类 似 于 图 7-3 中 语法 定义 的 字符 串 开 头 时 的 a 
的 个 数 必 须 等 于 结尾 处 c 的 个 数 。 要 想 对 C++ 的 语法 做 出 这 个 限制 ， 就 需要 包括 一 些 更 为 复杂 
的 、 上 下 文 相关 的 规则 。 让 编译 器 用 上 下 文 无 关 语 法 分 析 一 个 程序 ， 之 后 再 检查 是 否 违 反 一 些 
规则 ， 这 样 更 简单 一 些 。 通 常 借助 于 符号 表 来 检查 是 否 有 违反 这 些 语 法 不 能 描述 的 规则 。 


7.2 ARASH 


另 一 种 描述 语言 中 句子 语法 的 方式 是 有 限 状 态 机 。 以 图 的 形式 表示 ， 有 限 状 态 机 就 是 
一 个 状态 的 有 限 集合 ， 状 态 用 圆圈 表示 ， 称 为 结 点 ， 状 态 间 的 转换 用 圆圈 之 间 的 缴 表 示 。 每 
条 弧 从 一 个 状态 开始 ， 到 另 一 个 状态 结束 ， 在 结束 状态 有 一 个 箭头 。 每 条 弧 上 都 还 有 一 个 标 
号 ， 是 该 语言 终结 符 表 中 的 一 个 字符 。 

有 限 状 态 机 中 的 一 个 状态 被 指定 为 起 始 状 态 ， 至 少 一 个 ， 也 可 以 多 个 状态 被 指定 为 终止 
”状态 。 在 图 中 ， 起 始 状态 有 一 个 输入 箭头 ， 而 终止 状态 用 双 圈 表示 。 

数学 上 上， 这样 一 组 以 弧 连 接 的 结 点 称 作 图 。 当 弧 有 方 回 时 ，FSM 就 是 这 样 ， 称 为 有 问 
图 (directed graph 或 digraph). 


7.2.1 用 FSM 来 分 析 标 识 符 


图 7-10 给 出 了 一 个 FSM， 它 分 析 图 7-1 中 语法 定义 的 标识 符 。 状 态 集合 是 {A, B, C}, 
A 是 起 始 状态 ，B 是 终止 状态 。 对 一 个 字母 有 A 到 B 的 转换 ， 对 一 个 数字 有 A 到 C 的 转换 ， 
对 一 个 字母 或 数字 有 B 到 B 的 转换 ， 对 一 个 字母 或 数字 有 C 到 C 的 转换 。 
.要 使 用 FSM， 可 以 假想 输入 字符 串 写 在 一 张 纸 带 上 。 从 起 始 状 态 开 始 ， 从 左 至 右 扫 拉 
输入 纸 带 上 的 字符 。 每 次 从 纸 带 上 扫描 到 下 一 个 字符 时 ， 就 转移 到 有 限 状 态 机 的 下 一 个 状态 
上 。 只 能 使 用 弧 上 标识 的 字符 与 扫描 进来 的 字符 一 致 的 那些 转换 。 在 扫描 所 有 的 输入 字符 之 
后 ， 如 果 字 符 在 终止 状态 中 ， 那 么 这 个 字符 串 就 是 一 个 合法 的 标识 人 符 ， 否 则 就 不 是 。 

例 7.4 要 分 析 字 符 串 cab3， 需 要 做 下 面 这 样 的 转换 : 


(e) 


当前 状态 : A 输入 : cab3 扫描 c， 转 移 到 状态 B。 
当前 状态 : B 输入 : ab3 打 描 a， 转移 到 状态 B。 
当前 状态 : B 输入 : b3 扫描 b， 转 移 到 状态 B。 
当前 状态 : B 输入 : 3 扫描 3， 转 移 到 状态 B。 
当前 状态 : B 输入 : 检查 是 否 是 终止 状态 。 


因为 没有 输入 了 ， 所 以 最 后 的 状态 是 B， 是 终止 状态 ，cab3 就 是 一 个 合法 的 标识 符 。 O 
还 可 以 用 状态 转换 表 来 表示 FSM。 图 7-11 是 图 7-10 的 FSM 的 状态 转换 表 ， 表 中 列 出 
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了 从 一 个 给 定 的 当前 状态 在 给 定 输入 符号 时 转换 到 的 下 一 个 状态 。 





图 7-10 ”分析 标识 符 的 有 限 状 态 机 (FSM) 图 7-11 FA 7-10 AY FSM 的 状态 转换 表 
7.2.2 简化 的 有 限 状 态 机 


通常 通过 消除 FSM 中 的 一 些 状态 ， 对 图 进行 简化 会 更 方便 ， 比 如 删除 那 种 存在 的 唯一 
目的 就 是 为 非法 输入 字符 提供 转移 的 状态 。 这 个 状态 机 中 的 状态 C 就 是 这 么 一 种 状态 。 一 
旦 转移 到 状态 C， 就 永远 没 办 法 转移 到 其 他 的 状态 ， 输 入 字符 串 最 终 会 被 认定 为 非法 。 
图 7-12 给 出 了 图 7-10 的 FSM 的 简化 版 本 ， 没 有 了 失败 状态 。 

用 这 个 简化 的 状态 机 分 析 字 符 串 时 ， 在 输入 字符 串 中 遇 到 非法 字符 时 ， 没 有 办 法 进行 转 
移 。 有 两 种 方法 能 在 简化 的 状态 机 中 检测 出 非法 句子 : 

e 没有 输入 ， 但 是 却 不 在 一 个 终止 状态 中 。 

© 在 某 个 状态 中 ， 但 是 该 状态 没有 与 下 一 个 输入 字符 相对 应 的 转移 。 

图 7-13 是 图 7-12 对 应 的 状态 转换 表 。 对 于 去 掉 的 转移 ， 简 化 状态 机 对 应 的 状态 转换 表 
中 没有 对 应 的 条 目 。 注 意 ， 这 张 表 在 当前 状态 A 的 数字 一 栏 中 是 没有 内 容 的 。 本 章 余 下 部 
分 中 的 状态 机 都 使 用 简化 的 格式 。 










kaha 
| 





图 7-12 图 7-10 的 不 带 错误 状态 的 FSM 图 7-13 7-12 的 FSM 的 状态 转换 表 
7.2.3 非 确 定性 有 限 状 态 机 


当 使 用 语法 分 析 句 子 时 ， 对 于 一 个 推导 步骤 通常 必须 在 多 个 产生 式 规 则 中 选择 用 哪个 进 
行 替 换 。 类 似 地 ， 非 确定 性 有 限 状态 机 要 求 在 分 析 输 入 字符 串 时 从 多 个 转移 中 选择 。 图 7-14 
是 一 个 分 析 有 符号 整数 的 非 确 定性 FSM。 称 为 非 确定 ， 因 为 至 少 有 一 个 状态 对 于 一 个 字符 
有 多 于 一 种 转移 。 例 如 ， 状 态 A 对 于 一 个 数字 可 以 转移 到 B 也 可 以 转移 到 C。 对 于 状态 B 
也 有 一 些 不 确定 性 ， 如 果 下 一 个 输入 字符 是 一 个 数字 ， 转 移 到 B 或 者 C 都 有 可 能 。 

例 7.5 用 这 个 非 确定 性 FSM 来 分 析 +203， 必 须要 做 下 面 这 样 一 些 决策 : 


当前 状态 : A 输入 : +203 扫描 +， 转 移 到 状态 B。 
当前 状态 : B 输入 : 203 扫描 2， 转移 到 状态 Bo 
当前 状态 : B 输入 : 03 扫描 0， 转 移 到 状态 B。 
当前 状态 : B 输入 : 3 扫描 3， 转 移 到 状态 C。 
当前 状态 : C 输入 : 检查 是 否 是 终止 状态 。 


因为 没有 输入 又 处 于 终止 状态 C 中 ， 所 以 这 证 明了 输入 字符 串 +203 是 一 个 合法 的 有 符 
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号 整数 。 口 

在 用 产生 式 规 则 进行 分 析 时 ， 有 出 现 前 面 的 分 析 可 能 做 出 不 正确 选择 的 风险 。 可 能 进入 
一 个 死胡同 ,没有 替换 能 使 得 终结 符 和 非 终 结 符 组 成 的 中 间 字 符 串 更 接近 给 定 的 字符 串 。 进 
信 这 样 的 死胡同 并 不 一 定 就 表示 该 字符 串 是 非法 的 。 所 有 的 非法 字符 串 在 任何 尝试 中 都 会 进 
ASEAN], 但 是 如 果 在 前 面 的 推导 中 决策 错误 ,合法 的 字符 串 也 有 可 能 产生 死胡同 。 

对 于 非 确 定性 有 限 状 态 机 ， 同 样 有 这 个 问题 。 对 于 图 7-14 中 的 状态 机 ， 如 果 在 起 始 状 
态 A 中 ,下 一 个 输入 字符 是 7， 那 就 必须 在 转移 到 B 还 是 C 之 间 选 择 。 假 设 选择 转移 到 C, 
然后 发 现 还 有 一 个 输入 字符 要 扫描 。 因 为 从 C 没有 转移 出 来 ， 所 以 这 次 分 析 答 试 进入 了 死 
胡同 。 因 此 你 得 出 结论 ， 输 入 字符 串 是 非法 的 ， 还 是 合法 的 ; 只 是 在 前 面 某 个 地 方 做 出 了 错 
误 的 选择 。 

图 7-15 是 图 7-14 中 状态 机 的 状态 转换 表 。 非 确定 性 很 明显 ， 数 字 栏 中 有 多 项 (B,C)， 
它们 表示 在 尝试 分 析 时 需要 进行 选择 。 





数字 数字 
图 7-14 一 个 用 来 分 析 有 符号 整数 的 非 确 定性 的 FSM 图 7-15 图 7-14 的 FSM 的 状态 转换 表 
7.2.4 具有 空转 移 的 状态 机 


在 产生 式 规 则 中 引入 空 字 符 串 会 带 来 方便 ， 同 样 ， 构 建 具 有 对 空 字 符 串 转移 的 有 限 状态 
机 也 会 带 来 方便 。 这 样 的 转移 称 为 空转 移 。 图 7-16 是 图 7-17 中 的 FSM 的 状态 转换 表 。 
图 7-17 是 一 个 FSM， 对 应 于 图 7-2 中 的 语法 ， 用 来 分 析 有 符号 整数 。 


数字 
it. 
€ 


图 7-16 图 7-17 AY FSM 的 状态 转换 表 图 7-17 一 个 用 来 分 析 有 符号 整数 的 、 带 空转 移 的 FSM 


在 图 7-17 F, F 是 输入 第 一 个 字符 后 的 状态 ，M 是 数值 状态 ， 类 似 于 语法 中 的 非 终 结 
符 F 和 M。 同 样 ， 符 号 可 以 是 +、-- 或 者 两 者 都 不 是 ， 从 I 到 下 的 转移 可 以 接受 +、- 或 s。 
例 7.6 分 析 32， 做 出 如 下 决策 : 





当前 状态 : I 输入 : 32 扫描 gs ， 转 移 到 状态 下 。 
当前 状态 : F 输入 : 32 扫描 3， 转 移 到 状态 M。 
当前 状态 : M 输入 : 2 扫描 2， 转移 到 状态 M。 
当前 状态 : M 输入 : 检查 是 否 是 终止 状态 


接受 e 从 I 到 F 的 转移 不 消耗 输入 字符 。 当 处 于 状态 I 时 ， 可 以 做 3 件 事情 中 的 一 
(a) 扫描 +， 进 入 状态 ; (b) 扫描 -， 进入 状态 F ; 或 者 (c) 什么 也 不 扫描 (也 就 是 ， 空 
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符 串 )， 进 入 状态 F。 x 

具有 空转 移 的 状态 机 总 被 认为 是 非 确定 性 的 。 在 例 7.6 中 ， 不 确定 性 来 自 当 在 状态 工 中 
而 下 一 个 字符 是 + 时 必须 做 出 决策 ， 必 须 决定 是 从 I 到 下 接受 +，, 还 是 从 I 到 F 接受 s 。 这 
是 不 同 的 转移 ， 因 为 虽然 它们 转移 到 同一 个 状态 ， 但 是 剩 下 的 输入 字符 串 是 不 同 的 。 

给 定 一 个 带 有 空转 移 的 FSM， 总 是 可 以 把 它 变 换 为 一 个 等 价 的 、 不 带 有 空转 移 的 有 限 
状态 机 。 消 除 空转 移 的 算法 分 为 两 步 : 

© 如 条 有 一 个 转移 接受 e Mp 到 q， 对 于 每 个 接受 a 从 q 到 r 的 转移 ， 增 加 一 个 接受 

a 从 p 到 r 的 转移 。 
© WR q 是 一 个 终止 状态 ,把 p 也 变 成 终止 状态 。 
这 个 算法 使 用 s 的 连接 属性 : 
ca=a 

例 7.7 图 7-18 展示 了 如 何 从 (a) 中 的 状态 机 中 消除 空转 移 , 得 到 等 价 的 (b) 中 的 状 
态 机 。 因 为 有 一 个 接受 s MRA X 到 状态 Y 的 转 黎 ， 以 及 一 个 接受 a 从 状态 Y 到 状态 Z 
的 转移 ， 所 以 增加 一 个 接受 a 从 状态 和 X 到 状态 Z 的 转移 ， 就 可 以 消除 这 个 空转 移 了 。 如 果 
在 状态 X 中 ， 可 以 直接 接受 a 进入 状态 Z， 这 和 直接 接受 e WX AU Y 到达 Z， 进 入 的 状 


态 和 剩 下 的 输入 都 是 一 样 的 。 口 
a 
开始 开始 we 
一 一 一 > 
区 如 一 Me 
a) 原始 的 FSM b) 不 带 空转 移 的 等 价 的 FSM 


图 7-18 ”消除 空转 移 


例 7.8 图 7-19 给 出 了 对 图 7-17 的 FSM 的 变换 。 从 I 到 下 的 空转 移 被 蔡 换 为 接受 数字 
的 从 I 到 M 的 转移 ， 因 为 有 一 个 接受 数字 从 上 到 M 的 转移 。 E 


me 数字 
+ he ee 数字 
eC it, y 
€ 
a) 原始 的 FSM b) 删除 空转 换 


图 7-19 消除 图 7.17 的 FSM 中 的 空转 移 


在 例 7.8 PA F 到 M 只 有 一 个 转移 ， 所 以 
从 I 到 下 的 空转 移 只 用 替换 为 一 个 转移 。 如 果 
一 个 FSM 有 多 个 转移 来 自 空 转移 的 目标 状态 ， 
那么 在 消除 空转 移 时 ， 就 必须 添加 多 条 转移 。 

例 7.9 要 消除 图 7-20a 中 W 到 XX 的 空 
转 黎 ， 需 要 用 两 个 转移 来 替换 它 ， 一 个 是 接 
受 a 的 从 W 到 Y， 另 一 个 是 接受 b 的 从 W 
到 Z。 在 这 个 例子 中 ， 因 为 X 是 图 7-20a 的 RS itai 
终止 状态 ， 所 以 W 就 成 为 图 7-20b 中 等 价 状 图 7-20 ”消除 空转 移 
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态 机 的 一 个 终止 状态 ， 与 算法 中 的 第 二 步 保 持 一 致 。 口 

图 7-17 消除 了 空转 移 就 得 到 一 个 确定 性 的 状态 机 。 不 过 ， 一 般 来 说 ， 消 除 所 有 的 空转 
移 并 不 能 保证 得 到 的 FSM 就 是 确定 性 的 。 虽 然 所 有 带 有 空转 移 的 状态 机 都 是 非 确定 性 的 ， 
但 是 不 带 有 空转 移 的 仍然 有 可 能 是 非 确定 性 的 。 图 7-14 就 是 这 样 一 个 例子 。 

如 果 有 选择 的 话 ， 用 确定 性 的 FSM 分 析 总 比 用 非 确定 性 的 FSM 好 。 使 用 确定 性 的 状态 
机 ， 对 于 合法 的 输入 字符 串 是 不 可 能 做 出 错误 的 选择 而 进入 死胡同 的 。 一 旦 出 现 终 止 在 死 明 
同 里 的 情况 ， 就 可 以 得 出 结论 该 输入 字符 串 是 非法 的 。 

计算 机 科学 家 已 经 证 明 每 个 非 确定 性 的 FSM 都 有 一 个 等 价 的 确定 性 的 FSM， 也 就 是 说 ， 
有 一 个 确定 性 的 状态 机 能 够 识别 完全 一 样 的 语言 。 不 过 对 这 个 很 有 用 结论 的 证 明 超 出 了 本 书 的 
范围 ， 证 明 的 大 概 思路 就 是 说 明 如 何 从 一 个 非 确定 性 的 状态 机 构造 出 等 价 的 确定 性 的 状态 机 。 


7.2.5 ”语言 符号 识别 颖 


言 符 号 (token) 是 一 个 终结 符 的 字符 串 ， 作 为 一 个 整体 它 有 特殊 的 含义 。 这 组 字符 通 

常 对 应 于 语言 语法 中 的 某 个 非 终 结 符 。 例 如 ， 看 看 下 面 这 个 Pep/8 汇编 语言 : 

mask: .WORD OXOOFF 

这 个 语句 中 的 token ff mask: ,. .WORD, OX 和 00FF。 每 个 字符 组 都 来 自 于 汇编 语言 条 
号 表 ， 组 合 到 一 起 具有 特殊 的 含义 。 这 里 每 个 token 的 含义 分 别 是 符号 定义 、 点 命令 、 十 进 
制 数 指示 符 和 十 进 制 数值 。 

从 某 种 程度 上 说 ， 可 以 任意 选择 哪个 符号 组 来 表示 哪个 token。 例 如 ， 可 以 选择 字符 组 
OXOOFF 表示 十 进 制 数 token。 通 常 选择 使 得 FSM 的 实现 尽 可 能 简单 的 token 字符 。 

在 翻译 器 中 FSM 常见 的 使 用 是 在 源 字符 串 中 识别 token。 考 虑 汇编 器 在 收 到 源 字符 串 时 
的 工作 。 假 设 汇编 器 已 经 确定 mask: 是 符号 定义 ，.WORD 是 点 命令 ， 并 且 知 道 点 命令 后 
可 以 是 一 个 十 进 制 或 十 六 进 制 常 数 ， 所 以 编程 必须 接受 它们 。 需 要 FSM 能 够 确认 出 两 者 。 

图 7-21a 给 出 了 分 析 十 六 进 制 常 数 前 级 和 无 符号 整数 的 两 个 状态 机 。C 是 第 一 个 检测 OX 
的 状态 机 的 终止 状态 ，E 是 第 二 个 检测 无 符号 整数 的 状态 机 的 终止 状态 。 


语 


SE © an goo -日 
**0@> 0..9 € OP 0..9 


a) 两 个 独立 的 识别 0X 和 无 符号 整数 token 的 状态 机 b) 一 个 识别 0X 或 无 符号 整数 token 的 非 确定 性 的 FSM 
图 7-21 把 两 个 状态 机 合并 得 到 一 个 能 够 识别 两 种 token 的 FSM 


要 构建 一 个 能 够 识别 OX 和 无 符号 整数 的 FSM， 首 先 要 画 一 张 新 的 合并 后 的 状态 机 的 
起 始 状态 ， 在 这 个 例子 中 是 F。 然 后 再 画 出 从 新 的 起 始 状 态 到 每 个 单独 状态 机 中 起 始 状 态 的 
空转 移 ， 在 本 例 中 是 F 到 A 和 FEF 到 D。 结 果 就 得 到 一 个 可 以 识别 两 种 token 的 非 确 定性 的 
FSM。 结 束 的 终止 状态 表明 已 经 识别 出 了 该 token。 分 析 完 成 后 ， 如 果 终 止 在 状态 C， 就 表 
明 识 别 出 的 是 0x， 如 果 终 止 在 状态 E 中 ， 就 表明 识别 出 的 是 无 符号 整数 。 

要 想 让 这 个 状态 机 的 形式 能 更 方便 使 用 ， 就 要 消除 空转 移 。 图 7-22a 给 出 了 图 7-21b 
H FSM 消除 空转 移 后 的 状态 机 。 消 除 空 转移 之 后 ， 状 态 A 和 DD 是 不 可 达 的 。 也 就 是 说 ， 无 
论 输 入 字符 串 是 什么 ,永远 无 法 从 起 始 状 态 到 达 这 些 状 态 。 所 以 它们 不 会 影响 到 分 析 ， 可 以 
从 状态 机 中 去 除 ， 得 到 图 7-22b 所 示 的 图 。 
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a) 消除 空转 移 b) 消除 不 可 达 状 态 
图 7-22 ”对 图 7-21b 的 变换 


下 面 是 另 一 个 例子 ， 说 明了 翻译 天 需要 识别 出 多 个 token。 思 考 在 遇 到 下 面 这 样 两 行 代 


人 码 时 汇编 右 的 工作 : 
NOTE: LDA this,d :comment 1 
NOTA -comment 2 


Michael O. Rabin 和 Dana S. Scott 

Michael O. Rabin 和 Dana S. Scott 分 别 于 1956 年 和 1958 年 在 普林斯顿 大 学 获得 博 
士 学 位 ， 在 Alonzo Church ( 1903—1995 ) 
门下 学 习 。Church 是 普林斯顿 大 学 很 有 
影响 力 的 一 位 数学 教授 ， 在 计算 机 发 明 以 
前 ， 他 就 在 研究 基础 的 数学 逻辑 ， 他 的 工 
作对 计算 机 领域 有 很 长 远 的 影响 。 他 也 是 
很 多 在 计算 机 科学 领域 车 有 建树 的 科学 家 
的 研究 生 导 师 。Alan Turing 就 是 Church 
的 学 生 ， 在 他 的 指导 下 于 1938 年 获得 博 
士 学 位 。 其 他 一 些 学 生 包 括 John Kemeny, 
BASIC 编程 语言 的 发 明 者 之 一 ; Stephen Kleene, RMT Kleene 定理 ,该 定理 说 明了 有 
限 状 态 机 和 正则 表达 式 集合 之 间 的 等 价 性 。 

1931 年 ，Rabin 生 于 Breslau， 当 时 属于 德国 ， 现 在 是 波兰 的 一 座 城 市 。 虽 然 Rabin 
的 父亲 是 一 位 拉 比 (rabbi， 犹 太 教 的 法 师 )， 但 是 他 想 上 以 科学 著名 的 学 校 ， 而 不 是 宗教 
性 质 的 高 中 。 他 说 服 了 父亲 让 他 学 习 科 学 ， 并 最 终 在 20 世纪 50 年代 初期 进入 和 希 伯 来 大 
学 。 那 里 ， 他 阅读 了 Kleene 的 著作 《Introduction to Metamathematics (元 数学 导论 )。 这 
本 著作 中 有 一 章 是 关于 可 计算 性 和 图 灵机 的 ， 它 影响 了 Rabin 使 他 致力 于 计算 机 科学 的 基 
础 工作 。 

1932 年 Scott 生 于 加 利 福 尼 亚 州 伯克利 。 青 年 时 代 就 着 迷 于 数学 ， 进 入 加 利 福 尼 亚 大 
学 伯克利 分 校 决心 主 修 数学 。 获 得 学 士 学 位 后 进入 普林斯顿 大 学 攻读 博士 学 位 ， 也 是 数学 
专业 。Scott 在 普林斯顿 遇 到 了 Rabin， 他 认为 Rabin 是 一 个 总 是 非常 活跃 且 充 满 想法 的 
Ao ZA Rabin P Scott 几 年 毕业 ,但 是 他 们 俩 在 普林斯顿 之 后 仍然 继续 合作 。 

1957 年 的 夏天 ，Dana Scott 和 Michael Rabin 都 在 IBM 研究 中 心 工作 。 因 为 经 典 的 
图 灵机 被 认为 内 存 是 无 限 的 ， 而 实际 机 器 的 内 存 都 是 有 限 的 ， 所 以 图 灵机 作为 有 限 内 存 的 
模型 ， 并 不 是 实际 机 器 的 准确 模型 。Scott 和 Rabin 提出 了 非 确定 性 的 有 限 状 态 机 的 概念 ， 
并 研究 了 它 的 属性 。 因 为 这 种 机 器 的 状态 数量 是 有 限 的 ， 所 以 它 的 内 存 也 是 有 限 的 。 他 们 
证 明了 本 章 提 到 的 一 个 结论 ， 即 每 个 非 确定 性 的 FSM 都 存在 一 个 等 价 的 确定 性 的 FSM。 
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因为 他 们 1959 年 共同 发 表 的 论文 “Finite Automata and their Decision Problem” (有限 自 
动机 和 它们 的 决策 问题 )， 该 论文 基于 他 们 在 IBM 时 的 合作 工作 ，Dana Scott 和 Michael 
Rabin 在 1976 年 获得 了 A.M. ARR. 

Dana Scott 现 在 是 卡 内 基 梅 隆 大 学 计算 机 、 哲 学 和 数学 逻辑 (名 誉 退休 ) Hillman 


University 教授 。Rabin 是 哈佛 大 学 计算 机 科学 杰出 Thomas J. Watson Sr. 教授 ， 也 是 耶 路 
搬 冷 希 伯 来 大 学 的 客座 教授 。 他 的 另 一 项 成 就 是 设计 出 了 一 个 能 够 在 极 小 出 错 概率 下 快速 
找到 极 大 素数 的 算法 ， 这 也 是 下 面 这 向 引言 的 出 处 : 
“我 们 应 该 放弃 获得 完全 确定 性 的 结论 和 答案 的 尝试 .” 
Michael O. Rabin 





第 一 行 上 第 一 个 token 是 符号 定义 ， 第 二 行 上 第 一 个 token 是 一 元 指令 的 助 记 符 。 在 每 
ÍTR A, MTE Ae m a FSM 能 够 识别 出 符号 定义 ( 它 的 形式 是 标识 从 后 面 跟 一 个 分 号 ) 
或 助 记 符 ( 它 的 形式 是 标识 符 ) 。 图 7-23 就 是 这 样 一 个 多 token FSM. 

对 于 第 一 行 ， 这 个 状态 机 做 出 如 下 转移 : 

接受 N， 从 A 到 了 B 开始 字母 

接受 0， 从 B 到 B aes 

#2T, ABZIB 

接受 E， 从 B 到 B 图 7-23 分析 Pep/8 汇编 语言 标识 符 或 符号 

接受 :， 从 B 到 C 定义 的 FSM 
此 后 ， 翻 译 器 知道 它 识别 出 了 一 个 符号 定义 。 对 于 第 二 行 ， 它 做 出 如 下 转换 : 

接受 N， 从 A 到 了 B 

接受 0， 从 B 到 了 B 

$x T, 从 B 到 B 

接受 A,， 从 B 到 B 
因为 接 下 来 的 输入 符号 不 是 分 号 ， 所 以 FSM 不 会 转移 到 状态 C。 此 时 ， 翻 译 器 知道 它 识别 
出 了 一 个 标识 符 ， 因 为 终止 状态 是 B。 


7.3 实现 有 限 状态 机 

编程 语言 的 语法 通 稼 用 形式 语法 来 描述 ， 这 是 翻译 大 分 析 算法 的 基础 。 不 像 图 7-8 中 的 
语法 那样 描述 所 有 的 名 法， 形式 语法 通常 只 摘 述 较 高 层次 的 抽象 ， 把 低层 次 留 给 正则 表达 式 
或 有 限 状 态 机 来 描述 。 

图 7-24 摘 述 了 一 个 典型 编译 过 程 中 的 步 又。 低层 次 的 句法 分 析 称 为 词法 分 析 〈1lexical 
analysis)， 高 层次 的 句法 分 析 称 为 语法 分 析 ( parsing， 这 个 词 有 时 也 宽泛 地 用 来 包括 所 有 的 
句法 分 析 )。 在 大 多 数 人 工 语言 的 翻译 器 中 ， 词 法 分 析 器 基于 确定 性 的 FSM， 输 入 是 一 个 字 
符 串 。 语 法 分 析 需 通常 基于 语法 ， 输 入 是 来 上 月 词法 分 析 需 的 token 序列 。 


Ad hy #8 
( 语法 ) 


















词法 分 析 器 ee eo 
( 确定 FSM ) 代码 产生 器 目标 程 请 






十 法 语义 
图 7-24 ”编译 过 程 中 的 步骤 
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词法 分 析 絮 的 非 终结 符 是 语法 分 析 胡 的 终结 符 。 这 样 的 符号 的 一 个 第 见 例 子 是 标识 符 . 
词法 分 析 器 的 FSM 的 终结 符 表 包 括 单 个 的 字母 和 数字 ,输入 是 这 些 字符 组 成 的 字符 串 ， 然 
后 进行 状态 转换 。 如 果 输 入 是 字符 串 abc3, ABA FSM 声明 说 识别 出 了 一 个 标识 符 ， 并 且 把 
该 信息 传递 给 语法 分 析 器 。 语 法 分 析 胡 在 分 析 语 言 的 句子 时 ， 会 把 <identifier> (< 标识 符 >) 
作为 终结 符 。 

当 设 计 对 输入 进行 语法 分 析 的 软件 时 ， 描 述 规则 有 时 不 是 以 FSM 和 语法 的 方式 给 出 的 。 
不 过 如 果 输 入 的 结构 不 太 复杂 ， 可 能 可 以 把 词法 分 析 和 活 法 分 析 结 合 起 来 ， 直 接 从 问题 的 
描述 画 出 FSM 来 分 析 语 法 。 如 果 FSM 是 非 确 定性 的 ， 则 需要 把 它 转 化 成 等 价 的 确定 性 的 
FSM。 在 画 出 确定 性 的 FSM 之 后 ， 就 可 以 用 程序 来 实现 它 。 

较为 复杂 的 结构 ， 比 如 翻译 高 级 语言 的 编译 器 ， 通 常 都 需要 用 形式 语法 来 描述 。 通 常 不 
能 只 用 一 个 FSM 就 分 析 这 样 一 种 语言 的 句法 。 相 反 ， 必 须 把 句法 分 析 分 为 多 个 阶段 ， 如 
图 7-24 所 示 ， 使 用 更 高 级 的 技术 超出 了 本 书 讲授 的 范围 。 

实现 FSM 的 算法 有 一 个 枚 举 型 变量 ， 称 为 状态 变量 (state variable)， 它 的 可 能 值 对 应 
F FSM 的 可 能 状态 。 算 法 把 状态 变量 初始 化 为 机 需 的 起 始 状态 ， 在 循环 的 每 一 次 中 获取 终 
结 符 字符 串 的 一 个 字符 。 每 个 字符 都 会 导致 状态 的 一 次 改变 。 有 两 种 常见 的 实现 技术 : 

e 查找 表 

e 直接 编码 

在 这 两 种 方法 中 ， 状 态 变量 获取 它 下 一 个 值 的 方式 不 同 。 查 找 表 技术 存储 状态 转换 表 ， 
根据 当前 状态 和 输入 字符 查 表 获 得 下 一 个 状态 。 直 接 编 码 技术 在 代码 中 检测 当前 状态 和 输入 
字符 ， 直 接 把 下 一 个 状态 赋值 给 状态 变量 。 


7.3.1 查找 表 分 析 器 


图 7-25 中 的 程序 用 查 表 技 术 实 现 了 图 7-10 的 FSM。 变 量 FSM 是 图 7-11 所 示 的 状态 转 
换 表 。 程 序 把 输入 字符 分 成 字母 或 数字 。 因 为 B 是 终止 状态 ， 所 以 如 果 循 环 结束 时 状态 是 
B， 那 么 程序 会 声称 输入 字符 串 是 一 个 合法 的 标识 符 。 


#include <iostream> 
#include <cctype> // isalpha 
#Hinclude <string> // string 
using namespace std; 


enum State {eA, eB, eC}; 

enum Alphabet {eLETTER, eDIGIT}); 

State FSM[eC + 1][eDIGIT + 1] = { // Three rows, two columns 
» eC, // The state transition table of Figure 7.11 
» 28, 
» eC 





int main () { 
char ch; | 


string line; / 
Alphabet FSMChar; 
State state = eA; 





图 7-25 用 查找 表 技 术 实 现 图 7-10 的 FSM 
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cout << “Enter a string of letters and digits: "; 
cin >> line; 
for (int i = 0; i < line.size (); i++) 1 
ch = line[i]; 
if (isalpha (ch)) { 
FSMChar = eLETTER; 
} 
else { 
FSMChar = eDIGIT; 
} 
state = FSM[state][FSMChar]; 


} 
if (state == eB) { 
cout << line << " is a valid identifier.” << endl; 


] 


else { 
cout << line << " is not a valid identifier." << endl; 
} 
return 0; 
} 


输入 /输出 


Enter a string of letters and digits: cab3 
cab3 is a valid identifier. 


输入 /输出 


Enter a string of letters and digits: 3cab 
3cab is not a valid identifier. 





图 7-25 ( 续 ) 


该 程序 假设 用 户 只 会 输入 字母 和 数字 。 如 果 用 户 输入 其 他 的 字符 ， 程 序 会 把 它 当 作 数 
字 。 例 如 ， 如 果 用 户 输入 cab#， 程 序 会 认为 它 是 个 合法 的 标识 符 ， 而 实际 上 它 不 是 。 在 本 
章 末 尾 ， 留 给 读者 的 一 个 问题 就 是 改进 变量 FSM 并 实现 它 。 


7.3.2 直接 编码 分 析 器 


图 7-26 中 的 程序 使 用 直接 编码 技术 来 分 析 整 数 。 陆 数 parseNum 允许 用 户 输入 任意 字 
符 串 。 如 果 该 字符 串 不 是 合法 的 整数 ， 那 么 parseNum W vaild 返回 false, 程序 会 发 出 一 
条 错误 消息 。 否 则 ，valid X true, num 是 输入 整数 的 正确 的 值 。 


#include <iostream> 

#include <cctype> // isdigit 
#include <string> // string, getline 
using namespace std; 


// Global buffer 
string line; 
int lineIndex; 


void getLine () { 
// Get a line of characters. 
// Install a newline character as sentinel. 


图 7-26 程序 员 设 计 的 整数 串 的 语法 分 析 
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getline (cin, line); 
line.push_back ('\n'); 
lineIndex = 0; 


enum State {el, eF, eM, eSTOP}; 


void parseNum (bool& v, int& n) { 
int sign; 
State state; 
char nextChar; 
v = true; 
state = el; 
{ 
nextChar = line[lineIndex++]; 
switch (state) { 
case el: 
if (mextChar == '+') { 
sign = +1; 
state = eF; 
} 
else if (nextChar == '-') { 
sign = -1; 
state = eF; 


} 
else if (isdigit (nextChar)) { 


sign = +1; 


n = nextChar - '0'; 
state = eM; 

} 

else { 
v = false; 

} 

break; 

case eF: 

if (isdigit (nextChar)) { 
n = nextChar - ‘0°; 
state = eM; 

} 

else { 
v = false; 

} 

break; 

case eM: 

if (isdigit (nextChar)) { 
n= 10 * n + nextChar - '0'; 

} 

else if (nextChar == '\n') { 
n= sign * n; 
state = eSTOP; 

} 

else { 
v = false; 





图 7-26 (4) 
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} 
/} 
while ((state != eSTOP) && v); 
} 
int main () { 
bool valid; 
int num; 
cout << “Enter number: " 
getLine (); 
parseNum (valid, num); 
if (valid) { 
cout << “Number = " << num << endl; 
} 
else { 
cout << “Invalid entry.” << endl; 
} 
return 0; 
} 


输入 /输出 


Enter a number: q 
Invalid entry. 


输入 /输出 


Enter a number: -58 
Number = -58 





图 7-26 ( 续 ) 


输入 函数 getLine 从 键盘 读 和 人 字符 到 一 个 字符 串 。 无 论 用 户 输入 多 少 个 字符 ， 总 是 会 
以 换行 符 作 为 分 隔 。 如 果 用 户 没 有 输入 字符 ， 只 是 输入 了 一 个 回 车 键 ，getLine 会 把 换行 
符 放 在 1ine[0]。 

pki A parseNum 对 应 于 图 7-19b 的 FSM。 这 个 过 程 有 一 个 局 部 枚 举 型 变量 state， 它 
的 可 能 值 为 eI 、eF 或 eM， 对 应 于 这 个 FSM 的 状态 I、F 和 M。 另 外 ， 还 有 一 个 状态 称 为 
eSTOP ， 是 用 来 终止 循环 的 。 形 参 v 对 应 于 主 程序 中 的 实 参 valido RASH v 初始 化 为 
true， 把 state 初始 化 为 启 始 状态 eI。 

do 循环 模拟 有 限 状态 机 中 的 转移 ， 使 用 直接 编码 技术 。switch 语句 确定 当前 状态 ， 每 
种 情况 中 藤 套 的 if 语句 确定 下 一 个 字符 ， 而 代码 中 的 赋值 语句 直接 改变 状态 变量 。 

在 简化 的 FSM 中 ， 有 两 种 方式 来 停止 程序 一 一 要 么 输入 完 处 理 ， 要 么 到 达 了 一 个 状态 ， 
它 对 于 下 一 个 字符 没有 对 应 的 转移 。 在 后 一 种 情况 中 ， 输 入 字符 串 是 非法 的 。 对 应 于 这 两 种 
停止 条 件 ， 有 两 种 方式 来 退出 do 循环 当 到 达 输 入 分 隅 符 且 当前 状态 为 终止 状态 时 ， 或 
者 发 现 该 字符 串 是 非法 的 时 。 

do 循环 体 至 少 被 执行 一 次 。 即 使 回 车 键 是 第 一 个 被 按 下 的 键 ， 该 代码 也 会 正确 执行 。 
getLine 把 换行 符 放 在 1ine[0]。parseNum 把 state 初始 化 为 1， 进 入 do 循环， 立即 把 
nextChar 设置 为 换行 符 。 然 后 v 置 为 false， 循 环 正确 终止 。 

除了 确定 输入 字符 串 是 否 合法 外 ，parseNum 还 把 字符 串 转 换 为 适当 的 整数 值 。 如 果 第 
一 个 字符 是 + 或 者 数字 ，sign 置 为 +1。 如 果 第 一 个 符号 是 -，sign 置 为 -1。 在 I 或 F 状 
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态 中 检测 到 的 第 一 个 数字 会 把 n 设置 为 对 应 的 值 。 每 次 检测 到 后 续 的 数字 时 ，n 的 值 会 适当 
地 变化 。 如 果 循 环 结束 时 判定 是 一 个 合法 的 数字 ， 那 么 这 个 数值 会 乘 以 sign. 

计算 正确 的 整数 值 是 一 个 语义 行为 ， 而 状态 分 配 是 一 个 句法 行为 。 采 用 直接 编码 方式 能 
够 比较 容易 地 在 句法 处 理 中 加 入 语义 处 理 ， 因 为 在 句法 代码 中 有 明确 的 位 置 可 以 包含 需要 的 
语法 处 理 。 例 如 ， 在 状态 I 中， 如果 字符 为 -，sign 必须 设置 为 -1， 很 容易 确定 在 语句 代 
码 中 的 哪个 位 置 放 人 这 样 的 赋值 语句 。 

如 果 用 户 在 合法 的 数字 字符 串 前 加 上 了 一 些 空格 ， 那 么 FSM 会 认为 该 字符 串 非法 。 接 
下 来 的 这 个 程序 会 展示 如 何 纠 正 这 个 不 足 。 


7.3.3 输入 缓冲 区 类 


接 下 来 的 两 个 程序 使 用 同样 的 技术 从 输入 流 获 取 | // File: inBuffer.hpp 
字符 。 为 了 不 在 两 个 程序 中 重复 输入 处 理 的 代码 ， 本 
节 展 示 了 一 个 输入 缓冲 区 类 的 实现 ， 这 两 个 程序 都 可 
以 使 用 。 这 个 类 的 实现 存储 在 一 个 名 为 inBuffer . a. 
hpp 的 单独 文件 中 ， 每 个 程序 中 都 用 #inc1ude iff aera Tine 
句 把 它 包 含 进 来 。 图 7-27 给 出 了 这 个 称 为 头 文件 int lineIndex; 


#include <string> // string, getline 


的 .hpp 文件 。 ere 

正如 在 接 下 来 两 个 程序 中 展示 的 那样 ，FSM K void getLine () { 
数 有 时 会 发 现 来 自 输入 流 的 一 个 字符 终结 了 当前 ee ek ee 
的 token， 而 对 该 函数 接 下 来 的 调用 中 输入 流 还 会 iineIne sx = 0; 


需要 它 。 从 概念 上 说 ， 这 个 函数 必须 把 这 个 字符 退 

回 到 输入 流 ， 这 样 接 下 来 的 调用 才能 再 获取 到 它 。 ww 
backUpInput 提供 了 对 缓冲 区 类 的 这 样 一 种 操作 。 ch = line[lineIndex++]; 
虽然 FSM 函数 需要 访问 来 自 输入 缓冲 区 的 字符 , 但 | 

是 它 并 不 直接 访问 缓冲 区 。 只 有 过 程 getLine、 void backUpInput () { 
advanceInput fil backUpInput 访问 全 局 缓冲 区 。 | cael 

这 样 设计 的 目的 是 为 了 向 FSM 函数 提供 一 种 更 方便 | ); 


的 输入 流 抽象 结构 。 
图 7-27 包含 在 图 7-29 和 图 7-32 的 程序 
7.3.4 多 token 分 析 器 中 的 输入 缓冲 区 类 


如 果 C++ 编译 占 的 语法 分 析 需 在 分 析 字 符 串 

total = 
时 它 知 道 接 下 来 的 非 终 结 符 会 是 像 amount 这 样 的 
标识 符 或 者 像 100 这 样 的 整数 。 因 为 它 不 知道 接 下 
来 到 底 是 哪 种 token， 所 以 它 调 用 如 图 7-28 所 示 的 、 
能 够 识别 两 种 token 的 有 限 状 态 机 。 

标号 为 Ident 的 状态 是 识别 标识 符 token 的 终止 
RE, Int 是 识别 整数 的 终止 状态 。 从 Start 到 Start 
的 转移 接受 的 是 空 字符 ， 也 就 是 说 ， 人 允许 在 两 种 
token 之 前 有 空格 。 如 果 剩 下 的 字符 是 行 尾 的 空格 图 7-28 识别 标识 符 和 整数 的 程序 的 FSM 
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44, ABA FSM 过程 会 返回 空 token， 这 也 正 是 为 什么 启 始 状态 也 是 终止 状态 的 原因 。 

图 7-29 展示 了 一 个 实现 了 图 7-28 中 多 token 识别 器 的 程序 两 次 运行 的 输入 / 输出 。 第 
一 次 运行 有 两 行 输 义 ， 第 一 行 是 5 个 非 空 token， 第 二 行 是 6 个 非 空 token。 下 面 是 对 图 7-29 
中 第 一 次 运行 的 解释 。 


Input Input 
Here is A47 48B Here is A47+ 48B 
C-49 ALongldentifier +50 D16-51 C+49 

| Output ALongldentifier 

| Identifier = Here Output 

| Identifier = is ii! 
Identifier = A47 Identifier = Here 
Integer = 48 Identifier = is 
Identifier = B Identifier = A47 
Empty token Syntax error 
Identifier = C Identifier = C 
Integer = -49 Integer = 49 
Identifier = ALongIdentifier Empty token 
Integer = 50 Empty token 
Identifier = D16 Identifier = ALongIdentifier 
Integer = -5] Empty token 


Empty token 
图 7-29 识别 标识 符 和 整数 的 程序 的 输入 /输出 


状态 机 从 启 始 状态 开始 ， 扫 描 第 一 个 终结 符 H， 进 入 Ident 状态 。 接 下 来 的 终结 符 e、r 
和 e 都 继续 转移 到 同一 个 状态 。 接 下 来 的 终结 符 是 空格 ， 从 状态 Ident 没有 接受 终结 符 空格 
的 转移 。 因 为 当前 状态 机 是 在 标识 ! 符 的 终止 状态 中 ， 所 以 得 出 扫描 到 一 个 标识 符 的 结论 。 因 
eaten 空格 ， 所 以 把 它 放 回 输入 ， 作 为 下 一 个 token 的 第 一 个 终 

结 符 。 然 后 ， 状 态 机 声明 扫描 到 了 一 个 标识 符 。 

状态 机 重新 回 到 启 始 状态 ， 用 刚刚 剩 下 的 空格 转移 到 Start。 更 多 的 空格 也 都 使 得 继续 
转移 到 Start， 之 后 字符 i Al s 会 使 状态 机 识别 出 第 二 个 标识 符 ， 如 下 面 的 输出 所 示 。 类 似 
地 ， 会 识别 出 A47 也 是 一 个 标识 符 。 

对 于 下 一 个 token， 初 始 的 4 使 得 状态 机 进入 Int KAS, 8 使 得 转移 到 同一 个 状态 。 现 在 ， 
状态 机 的 输入 是 B， 从 状态 Int 没有 接受 终结 符 B 的 转移 。 因 为 当前 状态 机 是 在 整数 的 终止 
状态 中 ， 所 以 得 出 扫描 到 一 个 整数 的 结论 。 因 为 在 当前 这 个 状态 无 法 接受 终结 符 B， 所 以 把 
它 放 回 输入 ， 作 为 下 一 个 token 的 第 一 个 终结 符 。 然 后 ,状态 机 声明 扫描 到 了 一 个 整数 。 而 
在 下 一 轮 ，B 会 被 识别 为 一 个 标识 

状态 机 继续 识别 token 直到 到 达 行 尾 ， 此 时 它 识别 出 的 是 空 token。 无 论 输 入 最 后 有 没 
有 末尾 的 空格 ， 它 总 是 会 识别 到 空 token。 

第 二 个 输入 的 示例 展示 了 状态 机 如 何 处 理 包 含 句 法 错误 的 字符 串 。 在 确认 了 Here, is 
和 A47 之 后 ， 在 下 一 次 调用 中 ,该 FSM 得 到 +， 然 后 进入 Sign 状态 。 因 为 下 一 个 字符 是 空 
格 ，Sign 状态 没有 接受 空格 的 转移 ， 所 以 FSM 会 返回 非法 的 token。 

像 所 有 的 多 token 识别 器 一 样 ， 这 个 状态 机 按照 如 下 设计 原则 运行 : 

一 旦 进入 终止 状态 就 不 会 失败 。 如 果 没 有 接受 刚刚 输入 的 终结 符 的 转移 ， 就 是 
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识别 出 了 一 个 token， 退 回 最 后 一 个 输入 。 这 个 字符 会 作为 下 一 个 token 的 第 一 
个 非 终 结 符 。 


这 个 状态 机 能 够 正确 处 理 一 个 空 行 (或 者 一 个 只 有 空格 的 行 )， 一 次 调用 就 会 返回 空 


token o 


图 7-30 是 token 类 结构 的 统一 建 模 语言 ( Unified Modeling Language, UML) 图 示 。AToken 
是 一 个 抽象 的 token， 没 有 属性 ， 有 两 个 公共 的 抽象 操作 tokenType 和 printToken。 操 作 前 
面 的 + 号 是 UML 中 公共 访问 的 标记 。 空 心 三 角 符 号 是 UML 中 表示 继承 的 符号 。 图 7-30 表 
明 实 体 类 TEmpty, TInvalid, TInteger 和 Tidentifier 继承 自 AToken。UML 按 惯 例 


把 抽象 类 名 和 方法 用 斜体 表示 。 











+ tokenType(): Token 
+ printToken () 


ZN 



















TInvalid TIdentifier 





dl — identValue: string 
+TInteger (i: int) + TIdentifier (str: string) 


图 7-30 AToken 类 结构 的 UML Alas 


每 个 实体 类 必须 实现 它们 继承 自 超 类 的 抽象 方法 。 方 法 printToken 打印 如 图 7-29 所 示 
的 输出 。 方 法 tokenType 返回 一 个 枚 举 类 型 的 值 ， 表 明 识 别 出 的 token 的 类 型 。 除 了 继承 的 
方法 ， 类 TInteger 还 有 一 个 私有 属性 intyvalue， 它 存储 语法 分 析 器 识别 的 整数 值 ， 还 有 一 
个 公共 的 构造 器 。 属 性 前 面 的 - 号 是 UML 中 私有 访问 的 符号 。 类 似 地 ， 类 TIdentifier 也 


有 一 个 类 型 为 string 的 私有 属性 和 上 自己 的 构造 央 。 


图 7-31 展示 了 图 7-30 的 token 类 结构 对 应 的 C++ 实现 ， 它 是 完整 程序 代码 的 第 一 部 


分 ， 图 7-32 和 图 7-33 是 续 。Token 是 C++ AY enum 类 型 ， 它 的 值 对 应 着 4 个 实体 类 。 


#include <iostream> 
fHinclude <cctype> // isalpha, isdigit 
#include <string> // string, getline 
using namespace std; 


#include “inBuffer.hpp” // InBuffer 
InBuffer inBuffer; 


enum Token {eT_IDENTIFIER, eT_INTEGER, eT_EMPTY, eT_INVALID}; 


class AToken { 
public: 
virtual Token tokenType () = 0; 
virtual void printToken () = 0; 
13 


class TEmpty : nublic AToken { 
public: 
Token tokenType () { return eT_EMPTY; } 
void printToken () { cout << “Empty token" << endl; 3 





图 7-31 [A 7-30 中 AToken 类 的 C++ 实现 


7È EPF 


class TInvalid : public AToken { 
public: 
Token tokenType () { return eT_INVALID; } 
void printToken () { cout << "Syntax error" << endl; } 


J: 


class TInteger : public AToken { 
private: 
int intValue; 
public: 
TInteger (int i) { intValue = i; } 
Token tokenType () { return eT_INTEGER; } 
void printToken () { cout << “Integer = " << intValue << endl; } 


F; 


class TIdentifier : public AToken { 
private: 
string identValue; 
public: 
TIdentifier (string str) { identValue = str; } 
Token tokenType () { return eT_IDENTIFIER; } 
void printToken () { cout << “Identifier = " << identValue << endl; 
}; 


图 7-31 ( 续 ) 


enum State {es_START, eS_IDENT, eS_SIGN, eS_INTEGER, eS_STOP}; 


void getToken (AToken*& pAT) { 
// Pre: pAT is set to a token object. 
// Post: pAT is set to a token object that corresponds to 
// the next token in the input buffer. 
State state; 
char nextChar; 
int sign; 
int localIntValue; 
string localIdentValue; 
delete pAT; 
pAT = new TEmpty; 
state = eS_START; 


do { 
inBuffer.advanceInput (nextChar); 
Switch (state) { 
case eS_START: 
if (isalpha(nextChar)) { 
localIdentValue = nextChar; 
state = eS_IDENT; 


} 

else if (nextChar == '-') { 
sign = -l; 
state = eS_SIGN; 

} 

else if (nextChar == '+') { 
sign = +1; 


图 7-32 图 7-28 所 示 FSM 的 C++ 实现 
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state = eS SIGN; 

} 

else if (isdigit(nextChar)) { 
localIntValue = nextChar - '0'; 
Sign = +1; 
state = eS_INTEGER; 

} 

else if (nextChar == '\n') { 
state = eS _ STOP; 

} 

else if (nextChar != ' ') { 
delete pAT; 
pAT = new TInvalid; 


} 
break; 
case eS_IDENT: 
if (isalpha (nextChar) || isdigit (nextChar)) { 
localIdentVaiue.push_back (nextChar); 


} 
else { 
inBuffer.backUpInput (); 
delete pAT; 
pAT = new TIdentifier (localIdentValue); 
State = eS_STOP; 
} 
break; 
case eS_SIGN: 
if (isdigit (nextChar)) { 
localIntValue = nextChar - '0'; 
State = eS_INTEGER; 
} 
else { 
delete pAT: 
pAT = new Tinvalid; 
} 
break; 
case eS_INTEGER: 
if (isdigit (nextChar)) { 
localIntValue = 10 * localIntValue + nextChar - '0'; 
} 
else { 
inBuffer.backUpInput (); 
delete pAT; 
pAT = new TInteger (sign * localiIntValue); 
state = eS_STOP; 
} 
break; 


} 
while ((state != eS_STOP) && (pAT->tokenType () != eT_INVALID)); 





图 7-32 ( 续 ) 


图 7-32 是 图 7-28 所 示 FSM 的 直接 编码 实现 。 方 法 getToken 的 输入 是 一 个 传 引 用 调 
用 的 指针 pAT。 助 记 符 pAT 表示 “指向 抽象 token 的 指针 ”。getToken 的 前 提 假 设 是 pAT 
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已 经 被 设置 为 指向 一 个 已 经 分 配 好 空间 的 token， 其 初始 值 没有 关系 。 当 这 个 方法 需要 改变 
pAT 的 值 时 ， 会 删除 旧 值 ， 用 new 操作 符 分 配 一 个 新 值 。 这 种 使 每 个 new 都 匹配 对 应 于 一 
个 delete 的 编程 风格 能 够 帮助 预防 内 存 泄露 。 

图 7-33 给 出 了 主 函 数 。 它 有 一 个 抽象 token pAToken， 第 一 行 对 它 进行 初始 化 。 在 程序 
结束 前 执行 对 应 的 delete 操作 ， 同 时 还 保持 使 用 每 个 new 都 匹配 对 应 有 一 个 delete 的 编 
程 风 格 。 外 层 的 while 循环 对 输入 的 每 一 行 执行 一 次 ， 内 层 的 do 循环 对 一 行 中 的 每 个 token 
执行 一 次 。 输 出 依赖 多 态 来 显示 识别 出 的 不 同类 型 的 token。 也 就 是 说 ， 主 函数 没有 显 式 地 测 
试 token 的 类 型 来 选择 如 何 输出 它 的 值 ， 而 只 是 简单 地 让 抽象 的 token 调用 printToken 方法 。 


int main () { 
AToken* pAToken = new TEmpty; 
ijinBuffer.getLine (); 
while (!cin.eof ()) { 
do { 
getToken (pAToken); 
pAToken->printToken (); 


} 
while ((pAToken->tokenType () != eT_EMPTY) 
&& (pAToken->tokenType () != eT_INVALID)); 

inBuffer.getLine (); 

} 

delete pAToken; 

return 0; 

} 





图 7-33 图 7-32 所 示 token 识别 器 的 主 函 数 


7.4 代码 生成 


翻 详 是 把 东 种 输入 字符 表 的 字符 串 变 换 为 某 种 输出 字符 串 的 字符 串 。 这 种 翻译 的 典型 阶 
段 是 词法 分 析 、 语 法 分 析 和 代码 生成 。 本 节 包 括 一 个 程序 ， 它 把 一 种 语言 翻译 成 男 一 种 ， 用 
以 说 明 一 个 简单 日 动 翻译 右 的 所 有 3 个 阶段 。 


7.4.1 语言 翻译 器 


图 7-34 展示 了 翻译 需 的 输入 /输出 ， 输 入 是 源 代 码 ， 输 出 是 目标 代码 。 源 语言 和 目标 
语言 都 是 面向 行 的 ， 汇 编 语言 也 是 如 此 。 源 语言 的 句法 包括 C++ 函数 调用 ,目标 语言 赋值 
语句 的 句法 是 使 用 赋值 运算 符 :=。 输 入 语言 的 一 个 语句 示例 是 

set (Time, 15) | 
对 应 的 目标 语句 是 

Time := 15 
F set 是 源 语言 的 保留 字 ， 其 他 保留 字 包 括 add, sub, mul, div, neg fil end. 

Time 是 用 户 定 义 的 标识 符 。 标 识 符 的 定义 规则 与 C++ 语言 相同 。 例 如 前 面 例子 中 的 
15， 语 法 也 与 C++ 一 样 。 

set 过 程 有 两 个 参数 ， 通 过 去 号 隔 开 ,， 用 圆 括号 括 起 来 。 第 一 个 参数 必须 是 标识 符 ， 而 
第 二 个 参数 可 以 是 标识 符 ， 也 可 以 是 整数 常量 。 

翻译 的 另 一 个 例子 是 
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(Time, 15) (Alpha,, 123) 
(Accel, 3) (Alpha) 
(TSquared, Time) (Alpha, 123) 
(TSquared, Time) , (Alpha) 
(Position, TSquared) (Alpha, Beta 
(Position, Accel) (123, Alpha) 
(Position, 2) (Alpha, Beta) 
(Alpha, 123) x 


Time := 15 : Second argument not an identifier or integer. 
Accel := 3 : Comma expected after first argument. 
TSquared := Time : Line must begin with function identifier. 
TSquared := TSquared * Time : Left parenthesis expected after function. 
Position := TSquared : Right parenthesis expected after argument. 
Position := Position * Accel : First argument not an identifier. 
Position := Position / 2 : The argument of "neg" is malformed. 

: Illegal trailing character. 

: Missing “end™ sentinel. 





a) 第 一 次 运行 b) 第 二 次 运行 
图 7-34 ”从 一 种 语言 到 男 一 种 语言 翻译 程序 的 输入 / 输出 


mul (TSquared, Time) 


它 的 目标 代码 写作 

TSquared := TSquared * Time 

与 set 过 程 一 样 ，mu1 过 程 调用 的 第 一 个 参数 必须 是 标识 符 。 要 翻译 mul 语句 ， 翻 译 
傣 必 须 重复 它 的 第 一 个 参数 ， 它 出 现在 赋值 操作 符 的 两 边 。 

其 他 过 程 调用 类 似 ， 除 了 neg。neg 只 有 一 个 参数 ， 要 翻译 它 ， 就 要 在 赋值 运算 符 的 右 
边 先 写 一 个 短 画 线 符号 。 例 如 ， 源 程序 语句 

neg (Alpha) 
被 翻译 成 

Alpha := -Alpha 

保留 字 end 是 翻译 器 的 分 隔 符 ， 不 会 生成 任何 代码 ， 类 似 于 Pep/8 汇编 语言 中 的 .END。 
源 程 序 行 中 可 以 出 现任 意 数量 的 空格 ， 但 是 标识 符 和 整数 中 不 能 有 空 

如 果 输 入 流 中 出 现 语法 错误 ， 翻 译 器 不 一 定 前 省。 在 图 7-34 中 ， 还 有 一 次 运行 中 ， 源 
文件 里 有 各 种 错误 。 程 序 产生 适当 的 错误 信息 帮助 用 户 找到 源 程序 中 的 问题 (bug ) 。 

这 个 程序 基于 句法 的 两 阶段 分 析 ， 如 图 7-24 所 示 。 不 过 没有 像 图 中 表明 的 那样 用 语法 
来 描述 分 析 问 题 ， 这 个 源 语言 的 结构 很 简单 ， 可 以 直接 基于 FSM 构造 分 析 器 。 

图 7-35 是 产生 图 7-34 输出 程序 的 开始 部 分 代码 。 图 7-37、 图 7-39, I 7-41、 图 7-42、 
图 7-44 和 图 7-45 都 是 该 程序 的 代码 。 图 7-35 没有 给 出 程序 开头 的 #inc1lude 语句 。 操 作 
符 表 和 助 记 符 表 使 用 C++ 标准 模板 库 (Standard Template Libray, STL) 中 的 map 数据 结构 。 要 
使 用 map 数据 结构 ， 必 须 包 含 <map> 库 。 操 作 符 表 用 枚 举 类 型 的 助 记 符 值 作 为 关键 字 查找 字符 
串 符号 ， 并 放 到 生成 的 代码 中 。 助 记 符 表 用 源码 保留 字 的 小 写字 符 串 表示 查找 对 应 的 助 记 符 。 
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Global tables 
enum Mnemon { 
eM_ADD, eM_SUB, eM_MUL, eM_DIV, 
eM_NEG, eM_SET, eM_END, eM_EMPTY 


map <Mnemon, string> operatorTable; 
map <string, Mnemon> mnemonTable; 


void initGlobalTables () { 
operatorTable [eM ADD] = "+"; 
OperatorTable [eM SUB] = "-"; 
operatorfable [eM MUL] = "*"; 
operatorTable [eM DIV] = "/"; 
mnemontable ["add" J eM_ADD; 
mnemonTable ["sub"] eM_SUB; 
mnemonTable ["mul"] eM_MUL; 
mnemontable ["div"] eM_DIV; 
mnemonTable ["neg"] eM_NEG; 
mnemontable ["set"] eM_SET; 
mnemontable ["end"] eM_END; 

} 


void lookUpMnemon (string id, Mnemon& mn, bool& fnd) { 

string lowerlId = ""; 

for (int 1 = 0% 1 < tdesize (): T+) £ 
lowerId.push_back (tolower (id[i])); 

} 

if (mnemonTable.count (lowerId) == 1) { 
mn = mnemonTable[lowerld]; 
fnd = true; 

} 

else { 
fnd = false; 





图 7-35 翻译 程序 的 全 局 表 和 查找 晒 数 


PKŠ 1ookUpMnemon 的 输入 参数 是 字符 串 id， 它 检查 该 字符 串 是 否 在 助 记 符 表 中 。 如 
果 在 ， 把 参数 mn 设置 为 相应 的 枚 举 类 型 的 助 记 符 类 型 ， 并 把 fnd 设置 为 true ; 否则 ， 就 
把 fnd 设置 为 false。 该 程序 允许 源 代 码 
不 区 分 大 小 写 。 

图 7-36 是 抽象 参数 的 UML 图 示 ， 而 
图 7-37 Æ E C++ 实现 。 因 为 源 代 码 中 的 
参数 可 以 是 标识 符 ， 也 可 以 是 整数 ， 所 以 
程序 中 有 一 个 通用 的 参数 AArg， 它 在 运行 
时 可 以 是 IdentArg 也 可 以 是 IntArg。 类 
AArg 定义 了 一 个 抽象 的 方法 putArg, 4 
输出 参数 的 值 时 ， 就 用 它 来 生成 代码 。 图 7-36 ”类 结构 AArg 的 UML 图 示 








+ putArg () 








IdentArg 
— identValue: string 


+ IdentArg (str: string) 






— int Value: int 


+ IntArg (i: int) 
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/ / ======== The argument classes 
class AArg { 
public: 

virtual void putArg () = 0; 
E 


class IdentArg : public AArg { 
private: 
string identValue; 
public: 
IdentArg (string str) { identValue = str; } 


void putArg () { cout << identValue; } 
j}; 


class IntArg : public AArg { 

private: 
int intValue; 

public: 
IntArg (int i) { intValue = i; } 
void putArg () { cout << intValue; } 





图 7-37 (A 7-36 中 类 AArg 的 C++ 实现 


图 7-38 是 抽象 token 的 UML 图 示 ， 而 图 7-39 是 它 C++ 实现 的 部 分 代码 。 这 个 token 
的 结构 类 似 于 前 一 节 中 图 7-30 中 的 token 结构 。 方 法 tokenType 的 作用 与 前 面 一 样 。 方 法 
getArg 返回 指向 一 个 抽象 参数 的 指针 ， 它 只 适用 于 TIdentifier 和 TInteger， 因 为 AToken 
的 这 两 个 子 类 是 唯一 包含 代码 生成 硕 生 成 目标 代码 所 需 属性 的 类 。 对 于 FIdentifer，getArg 
返回 一 个 根据 它 的 identValue 新 分 配 的 IdentArg ; 而 对 于 FInteger，getArg 返回 一 
个 根据 它 的 intValue 新 分 配 的 IntArg。 


| 
+ tokenType ( ): Token 
+ getArg ( ); AArg* 


+ getIdent Value ( ): string 





Tldentifier TRightParen TInvalid 


| SSS: 
| |] E 
+ Tldentifier (str: string) | | + TInteger (i: int) 
TLeftParen TEmpty 


ae pene ee ey 
图 7-38 ”类 结构 AToken 的 UML Alas 


方法 getIdentValue 只 适用 于 TIdentifer。 当 词法 分 析 器 遇 到 保留 字 和 人 参数 时 ， 
它 返 回 一 个 标识 符 。 当 它 遇 到 保留 字 时 ， 话 法 分 析 器 需要 在 助 记 符 表 中 查找 这 个 字 ， 用 
getIdentValue 来 获取 token 的 标识 符 值 。 
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// == The token classes 

enum Token { 
eT_IDENTIFIER, eT_INTEGER, eT_COMMA, eT_LEFT_PAREN, 
eT_RIGHT_PAREN, eT_EMPTY, eT_INVALID 


class AToken { 
public: 
virtual Token tokenType () = 0; 
virtual AArg* getArg () { return 0; } 
virtual string getIdentValue () { return ""; } 


class TIldentifier : public AToken [ 
private: 
string identValue; 
public: 
TIdentifier (string str) { identValue = str; } 
AArg* getArg () { 
AArg* pArg = new IdentArg (identValue); 
return pArg; 
} 
Token tokenType () { return eT_IDENTIFIER; } 
string getIdentValue () { return identValue; } 
Fs 


class TInteger : public AToken { 
private: 
int intValue; 
public: 
TInteger (int i) { intValue = i; } 
AArg* getArg () { 
IntArg* pArg = new IntArg (intValue); 
return pArg; 
} 
Token tokenType () { return eT_INTEGER; } 
ie: 


class TComma : public AToken { 
public: 

Token tokenType () { return eT_COMMA; } 
E 





图 7-39 图 7-38 中 类 AToken 的 C++ 实现 


图 7-40 是 抽象 代码 类 Acode 的 UML 图 示 ， 图 7-41 是 它 C++ 实现 的 部 分 代码 。 类 
ACode 的 对 象 表示 目标 代码 的 一 行 。 执 行 方法 generateCode 把 该 行 代码 输出 到 cout - 
所 以 ,一 个 代码 对 象 必须 包含 输出 该 行 代码 所 需 的 所 有 数据 。 例 如 ， 图 7-40 展示 了 类 
TwoArgs 的 一 个 对 象 ， 它 有 两 个 属性 ，pFirstArg 和 pSecondArg， 两 者 分 别 都 是 指向 一 
个 抽象 参数 的 指针 。 除 此 之 外 ， 该 对 象 还 有 一 个 属性 mnemonic， 继承 自 它 的 超 类 Valid. 
考虑 图 7-34a 的 最 后 一 行 输 入 


div (Position, 2) 
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ACode 


Cee TA IEEE 
+ isError (): bool 
+ generateCode () 


ZN 
Valid 
See aA 
八 
ENoEnd 


aoe! 
ENoFunct po — pFirstArg: AArg* 


+ OneArg (mn: Mnemon, 
pF Arg: AArg*) 






+ TwoArgs (mn: Mnemon, 






ENoLeft + ~OneArg ( ) pF Arg: AArg*, pSArg: AArg*) 
+ ~TwoArgs ( ) 
EBad Ist 
(EERE 
EBadNeg F putArg () 
A 
ENoComma 


— identValue: string 
EBad2nd + IdentArg (str: string) + IntArg (i: int) 


ENoRight 


EExtraChars 


ik 


图 7-40 ”类 结构 ACode 的 UML Alas 


The code classes 
class ACode { 
public: 
virtual bool isError () = 0; 
virtual void generateCode () = 0; 


// ======== The error code classes 
class Error : public ACode { 
public: 

bool isError () { return true; } 


class ENoEnd : public Error { 
public: 
void generateCode () { 
cout << “Error: Missing \"end\" sentinel.”; 





图 7-41 图 7-40 中 类 ACode 的 C++ 实现 
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/ / ======== The valid code classes 
class Valid : public ACode { 
protected: 

Mnemon mnemonic; 
public: 

bool isError () { return false; } 
ie 


class ZeroArg : public Valid { 

public: 
ZeroArg (Mnemon mn) { mnemonic = mn; } 
void generateCode () { } // cout nothing 


rs 


class OneArg : public Valid { 
private: 
AArg *pFirstArg; 
public: 
OneArg (Mnemon mn, AArg* pFArg) { 
mnemonic = mn; 
pFirstArg = pFArg; 
} 
~OneArg () { delete pFirstArg; } 
void generateCode () { 
pFirstArg->putArg (); 
COUT os.” ee > 
pFirstArg->putArg (); 





图 7-41 (2£) 


这 个 代码 对 象 的 mnemonic 等 于 eM_DIV, pFirstArg 指 回 一 个 identValue “=F “Position” 
的 IdentArg, pSecondArg 指 回 一 个 intValue 等 于 2 的 IntArg。 类 OneArg 用 于 neg 语句 ， 
它 只 有 一 个 参数 。 

UML 中 表示 受 保 护 访问 的 符号 是 #， 与 图 7-40 中 valid 类 的 属性 中 使 用 的 一 样 。 表 
示 类 合成 的 UML 符号 是 实心 菱形 ， 连 接 OneArg 类 的 方 框 和 TwoArgs 类 的 方 框 。 类 合成 
的 含义 是 “有 一 个 "， 区 别 于 继承 的 含义 “是 一 个 ”。O0neArg 对 象 是 一 个 Valid 对 象 ， 而 
OneArg 对 和 象 有 一 个 AArg WHR. 

图 7-42 是 词法 分 析 需 的 一 部 分 代码 。 除 了 能 够 识别 图 7-38 所 示 的 7 种 token 之 外 ， 郴 
数 getToken 与 图 7-32 中 的 getToken 困 数 类 似 。 和 前 面 一 样 ， 形 参 pAT 是 一 个 指向 传 引 
用 调用 的 抽象 token 的 指针 。 

图 7-43 展示 了 一 个 描述 源 语言 的 确定 性 的 FSM， 图 7-44 是 其 实现 的 部 分 代码 。 该 状态 
机 的 转移 接受 来 自 词法 分 析 器 的 token， 即 图 7-39 中 以 eT 开头 的 字 。 终 止 状态 ePS_FINISH 
只 能 通过 输入 token eT_EMPTY 才能 到 达 。 如 果 输 入 行 是 空白 行 或 该 行 只 含有 空格 ， 那 么 就 
会 从 ePS_START 转移 到 ePS_ FINISH。 终 结 符 字符 串 end 是 唯一 一 个 使 得 状态 从 ePS_START 
转移 到 ePS_END 的 标识 符 。 对 应 于 其 他 保留 字 (set, and, sub, mul, div 和 neg) 的 标 
识 符 使 得 状态 从 ePS_START 转移 到 ePS FUNCTION。 如 果 在 ePS START 状态 检测 到 除 此 
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[| ======== The lexical analyzer 
enum LexState { 
eLS_ START, eLS_IDENT, eLS_SIGN, eLS_INTEGER, eLS_STOP 


H 


void getToken (AToken*& pAT) { 
// Pre: pAT is allocated to an irrelevant value. 
char nextChar; 
string locallidentValue; 
int localIntValue; 
int sign; 
delete pAT; 
pAT = new TEmpty; 
LexState state = eLS_START; 
do { 
inBuffer.advanceInput (nextChar); 
switch (state) { 
case eLS_START: 
if (isalpha (nextChar)) { 
localIdentValue = nextChar; 
state = eLS_IDENT; 


case eLS_INTEGER: 
if (isdigit (nextChar)) { 
JocalIntValue = 10 * localIntValue + nextChar - '0'; 
} 
else { 
inBuffer.backUpInput(); 
delete pAT; 
pAT = new TInteger (sign * localIntValue); 
state = eLS_STOP; 
} 
break; 
} 
} 
while ((state != eLS_STOP) && (pAT->tokenType () != eT_INVALID)); 





图 7-42 词法 分 析 器 


之 外 所 有 其 他 的 标识 符 都 是 非法 的 。 

图 7-45 是 产生 图 7-34 所 示 输 出 的 主 程序 的 完整 代码 。 布 尔 变量 terminateWithEnd 
控制 循环 的 结束 ， 被 初始 化 为 false 并 传 引 用 传递 给 processSourceLine。 只 有 end 语句 会 
把 terminateWithEnd 设置 为 true， 因 为 end 对 翻译 器 来 说 是 终止 分 隔 符 。 如 果 用 户 省 
略 end 语句 ， 主 函数 检测 到 已 经 到 达 文 件 的 结尾 而 没有 收 到 end 语句 ， 那 么 就 会 发 出 一 条 
适当 的 错误 信息 。 

执行 自动 翻译 的 三 个 阶段 的 函数 分 别 是 : 

e ijk Tak: getToken 

e 语法 分 析 器 : processSourceLine 

e 代码 生成 器 : generateCode 
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T l 
ePS_START ee ePS_END 


eT_IDENTIFIER? 


















ePS_FUNCTION 


eT_LEFT_PAREN 


ePS_OPEN 


eT_IDENTIFIER 













eT_RIGHT_PAREN? eT_EMPTY 





ePS_UNARY 


ePS_IST_OPRND 
eT_COMMA* 


ePS_COMMA 


eT_IDENTIFIER 
eT_INTEGER 


ePS_2ND_IDENT 


Note 1: Only the identifier end. 

Note 2: Onlv the identifiers set, add, sub, mul, div, and neg. 

Note 3: Only for mnemonic eM_NEG. 

Note 4: Only for mnemonics eM_SET, eM_ADD, eM_SUB, eM_MUL, and eM_DIV. 


图 7-43 图 7-44 的 语法 分 析 器 processSourceLine HW) FSM 


eT_EMPTY 


ePS_2_ARGS2 





eT_RIGHT_PAREN 


[| ======== The parser 

enum ParseState { 
ePS_ START, ePS_END, ePS_FUNCTION, ePS_OPEN, ePS_1ST_OPRND, 
ePS_UNARY, ePS_ COMMA, ePS_2ND_OPRND, ePS_NON_UNARY, ePS_FINISH 


void processSourceLine (ACode*& pAC, bool& term) { 
// Pre: term is false. 
// A source line is in inBuffer ready for processing. 
// pAC is allocated to an irrelevant value. 
AArg* pLocalFirstArg; 
AArg* pLocalSecondArg; 
Mnemon mnemon; 
delete pAC; 
pAC = new ZeroArg (eM_EMPTY); 
AToken* pAToken = new TEmpty:; 
ParseState state = ePS_START; 
do { 
getToken (pAToken); 
Switch (state) { 
case ePS_START: 
if (pAToken->tokenType () == eT_IDENTIFIER) 
string tempStr = pAToken->getIdentValue (); 
bool found; 
lookUpMnemon (tempStr, mnemon, found); 
if (found) { 
if (mnemon == eM_END) { 
delete pAC; 
pAC = new ZeroArg (eM_END); 
term = true; 
state = ePS_END; 





图 7-44 实现 图 7-43 的 FSM 的 语法 分 析 器 
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else { 
state = ePS_ FUNCTION; 


} 
else { 
delete pAC; 
pAC = new ENoFunct; 


} 

else if (pAToken->tokenType () == eT_EMPTY) { 
// pAC initialized to ZeroArg (eM_EMPTY) 
state = ePS_FINISH; 

} 

else { 
delete pAC; 
pAC = new ENoFunct; 

} 

break ; 


case ePS_COMMA: 
if ((pAToken->tokenType () == eT_IDENTIFIER) 
|| (pAToken->tokenType () == eT_INTEGER)) { 
pLocalSecondArg = pAToken->getArg (); 
delete pAC; 
pAC = new TwoArgs (mnemon, pLocalFirstArg, pLocalSecondArg); 


state = ePS_2ND_OPRND; 
} 
else { 
delete pAC; 
pAC = new EBad2nd; 
} 
break; 
case ePS_2ND_OPRND: 
if (pAToken->tokenType () == eT_RIGHT_PAREN) 
state = ePS_NON_UNARY; 
} 
else { 
delete pAC; 
pAC = new ENoRight; 
} 
break; 
case ePS _NON_UNARY: 
| if (pAToken->tokenType () == eT_EMPTY) { 
state = ePS_FINISH; 
} 
else { 
delete pAC; 
pAC = new EExtraChars; 
} 
break; 





图 7-44 ( 续 ) 


B7F AEA 259 


while ((state != ePS_FINISH) && (!pAC->isError ())); 


delete pAToken; 





图 7-44 ( 续 ) 


// ======== The main program 
int main () { 
bool terminateWithEnd = false; 
ACode* pACode = new ZeroArg (eM_EMPTY); 
initGlobalTables (); 
inBuffer.getLine (); 
while (! (cin.eof() || terminateWithEnd)) { 
processSourceLine (pACode, terminateWithEnd) ; 
pACode->generateCode (); 
cout << endl; 
inBuffer.getLine (); 


(!terminateWithEnd) { 
delete pACode; 

pACode = new ENoEnd; 
pACode->generateCode (); 
cout << endl; 


delete pACode; 
return 0; 





图 7-45 产生 图 7-34 Bran 4 oh A aE a AY EE 


TIE OD a Val ALTA OP OT ae, EPR BO AE — FT Sa A aD at. ERRA el AC 
码 生 成 器 ， 它 的 代码 生成 方法 分 布 在 不 同 的 对 象 中 。 


7.4.2 语法 分 析 器 特性 


可 以 不 用 图 7-43 中 的 FSM 来 定义 元 语言 的 名 法， 而 用 语法 来 定义 。 这 里 ， 这 个 源 语言 
的 形式 语法 结构 很 简单 。 例 如 ，set 语句 的 产生 式 规则 为 

<set-statement> — set ( <identifier> , <argument> ) 

再 用 一 条 产生 式 规 则 把 这 里 的 <argument> (< 实 参 >) 定义 为 <identifier> (< 标识 符 >) 
或 <integer> (< 整数 >)。 与 C++ 中 不 同 的 是 ， 这 个 语法 不 能 包含 递归 定义 。 

因为 源 句 法 很 简单 ， 所 以 对 该 语言 的 语法 分 析 可 以 基于 确定 性 的 FSM。 但 是 ， 大 多 
数 编程 语言 的 语法 分 析 器 没有 这 人 么 简单 。 虽 然 词 法 分 析 器 通常 可 以 基于 有 限 状态 机 ,但 
是 语法 分 析 需 是 比较 少见 能 够 基于 FSM 的 ， 实 际 中 大 多 数 语 言 太 复 杂 ， 没有 办 法 使 用 这 
项 技术 。 

因 为 一 个 真实 语法 的 产生 式 规 则 总 是 会 包含 许多 递归 定义 ， 所 以 分 析 程 序 也 包含 
递归 过 程 以 反映 语法 的 递归 特性 。 这 样 的 算法 称 作 递 归 下 降 分 析 器 (recursive descent 
parser). 


无 论 源 语言 的 复杂 度 或 者 翻译 器 的 分 析 技 术 如 何 ， 翻 译 器 中 语法 分 析 器 与 词法 分 析 器 


的 关系 都 是 一 样 的 : 语法 分 析 器 的 抽象 层次 高 于 词法 分 析 器 。 词 法 分 析 器 扫描 字符 ， 识 别 
token; 语法 分 析 器 扫描 token， 识 别 源 语言 程序 。 


总 结 


计算 机 科学 的 基本 问题 是 “什么 能 够 被 自动 化 ?” 人 工 语言 的 自动 化 翻译 是 计算 机 科学 
的 核心 。 每 种 人 工 语言 都 有 一 个 符号 表 。 一 个 集合 的 闭 包 ,7 ， 是 连接 了 中 元 素 能 够 形成 的 
所 有 可 能 字符 串 的 集合 。 语 言 是 它 的 字符 表 闭 包 的 一 个 子 集 。 语 法 描述 语言 的 句法 ， 有 4 个 
部 分 : 一 个 非 终 结 符 表 ; 一 个 终结 符 表 ， 一 组 产生 式 规则 和 一 个 起 始 符号 。 推 导 是 语法 说 明 
语言 的 过 程 。 为 了 推导 出 语言 的 一 个 句子 ， 要 从 起 始 符号 开始 ， 用 产生 式 规 则 做 替换 ， 直 到 
得 到 一 个 终结 符 字 符 串 。 语 法 分 析 问 题 是 确定 推导 序列 ， 使 之 与 一 个 给 定 的 终结 符 字 符 串 
匹配 。 标 准 C++ 语法 有 上 百 条 产生 式 规则 。 上 下 文 无 关 语 法 是 限制 产生 式 规 则 左边 只 能 包 
含 一 个 非 终 结 符 的 语法 。 虽 然 C++ 语法 是 上 下 文 无 关 的 ， 但 是 它 的 某 些 方面 是 上 下 文 相 
天 的 。 

有 限 状态 机 (FSM) 也 能 描述 语言 的 句法 ， 由 一 组 状态 和 状态 之 间 的 转移 组 成 。 每 个 转 
移 都 标明 有 一 个 输入 终结 符号 ， 有 一 个 状态 是 起 始 状 态 ， 至少 有 一 个 ， 也 可 能 有 多 个 终止 状 
态 。 非 确定 性 的 FSM 中 从 一 个 给 定 状 态 对 于 一 个 输入 终结 符 ， 可 能 有 多 个 转移 。 如 果 从 起 
始 状态 出 发 ， 有 一 个 转移 序列 接受 句子 中 的 符号 ， 使 得 最 后 以 终止 状态 结束 ， 那 么 这 个 句子 
就 是 合法 的 。 

FSM 的 两 个 软件 实现 技术 是 : 查找 表 技术 和 直接 编码 技术 。 两 种 技术 都 包含 由 状态 变 
量 控 制 的 循环 ， 这 个 状态 变量 会 被 初始 化 为 起 始 状态 。 循 环 的 每 次 执行 都 对 应 于 FSM 中 的 
一 次 转移 。 在 查找 表 技 术 中 ， 转 移 是 由 一 个 二 维 转移 表 确 定 的 ; 而 在 直接 编码 技术 中 ， 转 移 
是 由 循环 体内 的 选择 语句 指定 的 。 

自动 翻译 需 的 3 个 翻译 阶段 是 词法 分 析 器 、 语 法 分 析 右 和 代码 生成 侨 。 对 于 大 多 数 高 级 
语言 来 说 ,词法 分 析 絮 基于 FSM， 语 法 分 析 器 基于 上 下 文 无 关 文法 ,代码 产生 器 严重 依赖 
于 目标 语言 。 


练习 


7.15 
*1 计算 机 科学 的 基本 问题 是 什么 ? 
2. 整数 加 法 运算 的 单位 元 是 什么 ? 布尔 数 的 OR 运算 的 单位 元 是 什么 ? 
3. 用 图 7-1 的 语法 推导 出 下 面 的 字符 串 ， 画 出 相应 的 词法 树 。 
* (a) abc123 (b) alb2c3 (c) a321be 
4. 用 图 7-2 的 语法 推导 出 下 面 的 字符 串 ， 画 出 相应 的 词法 树 。 
*(a) =d (b) +ddd (c) d 
5. 用 图 7-3 的 语法 推导 出 下 面 的 字符 串 。 
* (a) abc (b) aabbcc 
6. 对 于 下 面 每 个 字符 串 ， 说 明 是 否 能 从 图 7-5 的 语法 规则 推导 出 来 。 如 果 可 以 ， 画 出 对 应 的 语法 树 : 
*(a)at(a) (b) a* (+a ) (c)a*( ata ) 
(d)a*(Cata)*ale)at(-a) te Ce EH) 
7. 对 于 图 7-8 的 语法 ， 画 出 <statement> (< 语句 >) 对 于 下 列 字 符 串 的 语法 树 ， 假 设 S1、S2、S3、 
S4、C1 Al C2 都 是 合法 的 <expression> (< 表达 式 >): 
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*fal { CL (b) { if (C1) 
Si it (C23 
S2; SI.: 
} else 
52: 
S3: 
} 
(ej if (C1) (d) { $1; 
TF (C2) while (Cl ) 
51s £ TPF CCZ) 
else S25 
S2: $35 
else } 
$3. } 
S4; 


} 


8. 对 于 图 7-8 的 语法 ， 画 出 <statement> (< 语句 >) 对 于 下 列 字 符 串 的 语法 树 ， 假 设 alpha, beta 和 
gamma 都 是 合法 的 <identifier> (< 标识 符 >)，1 和 24 都 是 合法 的 <constant> (< 常数 >): 


*(qa)alpha = 1 ; 
(b) alpha = alpha + 1 ; 
(c) alpha = (beta * 1) ; 
(d) alpha = ((beta + 1) * (gamma + 24)) ; 
(e) alpha (beta) ; 
(f) alpha (beta, 24) ; 


9. 对 于 图 7-8 的 语法 ， 画 出 <translatioin-unit> (< 翻译 单元 >) 对 于 下 列 字符 串 的 语法 树 ， 假 设 
alpha, beta, gamma 和 main 都 是 合法 的 <identifier> (< RRIF >), c1, S1 和 S2 都 是 合法 的 
<expression> (< 表达 式 >): - 


int main() 

{ int gamma; 
alpha (gamma); 
if (Ci) 


10. 本 练习 提出 的 问题 是 “两 个 不 同 的 语法 能 产生 同一 种 语言 吗 ?” 图 7-46 和 图 7-47 中 的 语法 是 不 同 
的 ， 它 们 有 不 同 的 非 终结 符 集 合 和 不 同 的 产生 式 规则 。 用 这 两 种 语法 做 实验 ， 推 导 一 些 终结 符 字 符 
串 。 通 过 你 的 实验 ， 描 述 这 两 种 语法 产生 的 语言 。 可 以 根据 图 7-46 的 语法 推导 出 用 图 7-47 的 语法 
推导 不 出 来 的 合法 终结 符 字符 串 吗 ?” 反 过 来 呢 ? 证 明 你 的 推测 。 


the productions 
1.A>0B the productions 


2B 510B 1.C3C10 
3B ye 2.C 一 0 


S=A 





图 7-46 练习 10 的 语法 图 7-47 练习 10 的 另 一 个 语法 
7.2% 


11. 对 于 图 7-48 给 出 的 每 个 状态 机 ，( a) 说 明 这 个 FSM 是 确定 性 的 还 是 非 确 定性 的 ，(b) 识别 出 所 有 
不 可 达 的 状态 。 
12. 为 图 7-49 中 的 每 个 有 限 状态 机 消除 空转 移 ， 得 到 等 价 的 状态 机 。 
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图 7-49 练习 12 的 FSM 


13. 画 一 个 有 限 FSM， 能 够 识别 以 下 标准 指定 的 1 和 0 的 字符 串 。 每 个 FSM 拒绝 所 有 非 0 或 1 的 字 


符 。* (al 3 个 字符 的 字符 串 ，101。(b) 所 有 长 度 任意 以 101 结尾 的 字符 串 。 例 如 ， 该 FSM 应 该 
-能够 接受 1101， 但 是 拒绝 1011。(c) 所 有 长 度 任意 以 101 开头 的 字符 串 。 人 例如， 该 FSM 应 该 接 
受 1010， 但 是 拒绝 0101. (d) 所 有 长 度 任 意 且 至 少 包含 一 个 101 的 字符 串 。 例 如 ， 该 FSM 应 该 
能 够 接受 (a) (b) 和 (c) 中 提 到 的 所 有 字符 串 ， 以 及 像 11100001011111100111 这 样 的 字符 串 。 

73$ 

14. 设计 一 个 描述 图 7-44 中 翻译 器 的 源 语言 的 语法 。 

15. 画 出 图 7-32 中 过 程 getToken 中 FSM 的 状态 转移 图 。 


问题 

lan 

16. 按照 本 书 所 建议 的 那样 ， 改 进 图 7-25 中 的 程序 ， 在 Alphabet 中 定义 第 三 个 枚 举 值 other, EK 
示 既 不 是 字母 又 不 是 数字 的 符号 。 

17. 用 图 7-25 中 程序 的 查找 表 技 术 实 现 练习 13 中 的 每 个 FSM。 和 转移 表 中 要 把 字符 区 分 为 eONE、 
eZERO 或 eOTHER。 从 键盘 获取 输入 。 

18. 用 图 7-26 中 程序 的 直接 编码 技术 实现 练习 13 中 的 每 个 FSM。 从 键盘 获取 输入 。 写 一 个 名 为 
parsePat 的 过 程 来 分 析 对 应 于 parseNum 的 模式 。 该 过 程 中 不 要 使 用 形 参 n。 

19. 十 六 进 制 数字 是 “0” … SO’. far SF? 或 “A”…“F"”。 一 个 十 六 进 制 常数 由 1 一 4 个 的 
十 六 进 制 数字 组 成 ， 例 如 3、a、0d 和 FF4e。 用 直接 编码 技术 实现 一 个 有 限 状 态 机 ， 就 像 图 7-26 
中 的 一 样 ， 分 析 十 六 进 制 常数 ， 并 把 它 转换 为 非 负 整数 。 输 入 /输出 应 该 与 图 7-26 类 似 ， 非 法 输 
入 会 产生 错误 消息 ， 合 法 十 六 进 制 输 入 字符 串 会 产生 非 负 整 数值 。 下 面 <cctype> P H ea Be fE 
会 有 用 。ch 的 类 型 为 char。 
isxdigit(ch)， 如 果 ch 是 一 个 十 六 进 制 数字 ， 返 回 true。 
isdigit(ch)， 如 果 ch 是 一 个 十 进 制 数字 ， 返 回 true, 
isupper(ch)， 如 果 ch 是 一 个 大 写字 母 ， 返 回 true. 
islower(ch), WẸ ch 是 一 个 小 写字 母 ， 返 回 true. | 
toupper(ch), WR ch 是 一 个 小 写字 母 ， 就 返回 ch 的 大 写字 母 ， 否 则 返回 chs 
tolower(ch)， 如 果 ch 是 一 个 大 写字 母 ， 就 返回 ch 的 小 写字 母 ， 否 则 返回 ch. 
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20. 为 Pep/8 汇编 语言 写 一 个 有 限制 的 汇编 器 。 源 程序 包含 的 汇编 语言 程序 不 含 符号 ， 具 有 助 记 符 BR、 
DECI, LDA, ADDA, STA, DECO 和 STOP; 点 命令 有 .BLOCK 和 .END; 以 及 十 六 进 制 和 十 进 制 常 数 。 
例如 ， 如 果 源 程序 如 下 所 示 : 


BR 0x0007， i 
.BLOCK 4 


STA 0x0004,d 
DECO 0x04,d 


那么 汇编 器 应 该 输出 如 下 的 目标 程序 
04 00 07 00 00 00 00 31 00 02 C1 00 02 70 FF FB 
El 00 04 39 00 04 00 zz 
装载 器 不 接受 目标 程序 行 末 有 空格 。 

假设 源 程序 行 中 没有 注释 。 所 有 的 寻 址 方式 都 是 显 式 的 ， 即 使 是 对 于 BR 指令 。 验 证 一 条 指令 的 
寻 址 方式 是 否 合法 ， 如 果 不 合法 就 给 出 错误 提示 。 助 记 符 和 点 命令 可 以 大 小 写字 符 混 用 。 除 了 助 记 
符 或 点 命令 之 后 一 定 要 跟 至 少 一 个 空格 以 外 ，token 之 间 可 以 有 零 个 或 多 个 空格 。 如 果 源 文件 包含 一 
个 或 多 个 错误 ,输出 相应 的 消息 ， 建 议 输出 给 目标 文件 。 按 照 列 出 的 顺序 实现 下 面 的 里 程 碑 节点 。 
(a) 写 出 过 程 getToken， 它 实现 图 7-50 的 FSM。 声 明 下 面 这 样 一 个 枚 举 类 型 . 


enum Token { 
eT_IDENTIFIER, eT_DOT_COMMAND, eT_DEC_CONST, 
eT_HEX_CONST, eT_ADDR_MODE, eT_EMPTY, eT_INVALID 
KS 


X 
Cema 


数字 十 六 进 制 数字 
数字 
elLS INT2 )) > eLS_HEX2 
空格 /1..9 
数字 " 
a 十 六 进 制 数字 
—__——»/((eLS_START eLS_SIGN 
字母 
字母 
eLS_IDEND > 数字 
字母 
数字 


CD 一 


了 
eee 
数字 


图 7-50 问题 20 (a) 中 getToken 的 FSM 


Hy} 
ie 
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设计 一 个 类 似 于 图 7-31 中 的 抽象 ttken， 画 出 它 的 类 似 于 图 7-30 中 的 UML 图 示 。 

用 类 似 于 图 7-33 中 的 main() 来 测试 你 的 程序 ， 输 出 token 列表 和 它们 的 值 。 点 命令 的 属性 和 

寻 址 方式 应 该 是 字符 串 ， 十进制 常数 和 十 六 进 制 常数 的 属性 应 该 是 整数 。 你 的 测试 字符 串 中 应 

该 包含 合法 token 序列 的 字符 串 ， 也 应 该 包含 会 产生 句法 错误 的 字符 串 。 输 入 用 图 7-27 中 的 

inBuffer.hpp. 

(b) 画 出 对 应 于 图 7-43 语法 分 析 器 的 FSM 的 状态 转移 图 。 假 设 每 个 转移 接受 (a) 部 分 中 列 出 的 
那些 token 中 的 一 个 。 

(c) 基于 (b) 部 分 中 的 状态 转移 图 ， 完 成 过 程 processSourceLine。 声 明 下 面 这 样 一 个 枚 举 类 型 : 


enum Mnemon { 
eM_BR, eM_DECI, eM_LDA, eM_ADDA, 
eM_STA, eM_DECO, eM_STOP 

} 


enum AddrMode { 
eA_IMMED, eA_DIRECT, eA_INDIRECT, eA_STACK_REL 
eA_STACK_REL_DEF, eA_INDEXED, eA_STACK_INDEXED, 
eA_STACK_INDEXED_DEF 

j; 

设计 抽象 参数 AArg， 它 有 两 个 子 类 ， 分 别 描述 十 六 进 制 常 数 和 十 进 制 常数 ， 每 个 都 有 一 个 整 
型 属性 。 往 你 的 token 类 中 添加 一 个 方法 getArg。 设 计 你 的 抽象 代码 类 Acode， 像 图 7-40 那样 。 
Valid 类 不 能 含有 助 记 符 属性 ， 应 该 有 5 个子 类 : Empty 是 为 了 空 行 ; Unary 是 为 了 一 元 STOP 
指令 ; NonUnary 是 为 了 BR、DECI、LDA、ADDA、STA 和 DEC0 指令 ; DotBlock 是 为 了 .BLOCK 
伪 操作 ; 而 DotEND 是 为 了 .END 伪 操 作 。Unary 和 NonUnary 类 应 该 有 一 个 枚 举 类 型 的 助 记 符 。 
NonUnary 和 DotBlock 类 应 该 有 一 个 抽象 参数 。NonUnary 类 应 该 有 一 个 枚 举 类 型 的 AddrMode 
属性 。 用 C++ map 实现 的 寻 址 方式 表 把 token 中 的 寻 址 方式 的 字符 串 表 示 转 换 到 枚 举 类 型 的 值 。 

用 类 似 于 图 7-45 中 的 主 程序 来 测试 你 的 程序 。 现 在 ， 你 的 generateCode 方法 已 经 可 以 输出 
具有 参数 和 寻 址 方式 的 每 条 指令 和 点 命令 分 析 的 描述 。 你 的 测试 字符 串 中 应 该 包含 合法 指令 序列 
的 字符 串 ， 也 应 该 包含 会 产生 错误 的 字符 串 。 

Cd) 向 你 的 汇编 器 中 增加 十 六 进 制 代码 生成 部 分 。 除 了 变量 pACode 外 ， 声 明 一 个 如 下 代码 结构 的 
数组 : 

ACode* codeTable[256]; 

int codeIndex; 

在 主 程序 开头 ， 把 codeIndex 初始 化 为 0。 每 分 析 一 个 源 代码 行 ， 就 把 来 自 该 行 的 信息 存储 到 

CodeTable[codeIndex], 再 把 codeIndex 加 1。 如 果 所 有 的 行 都 分 析 完 了 ， 且 没有 错误 ， 就 在 

这 个 代码 数组 上 循环 生成 目标 代码 。 

(e) 扩展 这 个 汇编 器 ， 包 括 Pep/8 指令 集中 所 有 39 条 指令 。 

(£) 扩展 这 个 汇编 器 ， 人 允许 分 支 指令 不 指定 寻 址 方式 ， 此 时 使 用 默认 的 方式 立即 数 寻 址 。 

(g) 扩展 这 个 汇编 器 ， 生 成 这 样 的 列表 ， 把 目标 代码 写 在 生成 它 的 源 代码 行 旁 边 。 使 用 Pep/8 汇编 

名 标准 的 空格 规则 和 大 小 写 规 则 输出 源 代码 行 。 

(h) 扩展 这 个 汇编 器 ， 人 允许 用 单 引 号 扩 起 字符 常量 。 

(i) 扩展 这 个 汇编 器 ， 人 允许 点 命令 .WORD 和 .BYTE。 

G) 扩展 这 个 汇编 器 ， 人 允许 点 命令 .ASCII， 字 符 串 用 双 引 号 括 起 来 。 

(k) 扩展 这 个 汇编 器 ， 人 允许 源 代 码 行 包含 以 分 号 开始 的 注释 。 一 行 可 以 只 包含 一 条 注释， 也 可 以 一 

条 合法 指令 后 面 跟 一 条 注释 。 


| 第 五 部 分 


Computer Systems, Fourth Edition 


操作 系统 层 CB 4 JB) 





O MRAR E 





P 8 ix | 


Computer Systems, Fourth Edition 


进程 管理 





操作 系统 定义 了 一 个 比 ISA3 层 机 器 更 抽象 的 机 器 ， 更 容易 对 它 编程 。 其 目的 是 向 高 级 
语言 提供 一 个 更 加 方便 的 环境 ， 并 更 有 效 地 分 配 系统 资源 。 操 作 系 统 层 位 于 汇编 层 和 机 器 层 
之 间 。 与 一 般 的 抽象 一 样 ， 操 作 系 统 回 更 高 层次 的 用 户 隐藏 ISA3 层 机 器 的 细节 。 

典型 计算 机 系统 的 资源 包括 CPU 时 间 、 主 存 和 磁盘 存储 器 。 本 章 讲 述 操作 系统 怎样 分 
Ac CPU 时 间 ， 接 下 来 的 第 9 章 讲 述 它 怎 样 分 配 主 存 和 磁盘 存储 器 。 

操作 系统 一 般 分 为 3 类 : 

e 单 用 户 

e 多 用 户 

e 实时 

许多 个 人 计算 机 是 单 用 户 操作 系统 ， 这 些 计算 机 对 于 个 人 来 说 不 贵 买 得 起 用 得 起 ， 不 用 
和 其 他 人 共享 。 大 型 计算 机 几乎 都 是 组 织 机 构 所 有 而 不 是 个 人 所 有 ， 它 们 使 用 多 用 户 操作 系 
统 。 这 样 的 计算 机 通常 只 有 一 个 CPU, 但 是 它 却 足 够 快 ， 能 同时 执行 许多 用 户 的 作业 。 计 
算 机 中 使 用 的 实时 系统 专门 用 于 控制 设备 ， 它 们 的 输入 来 自传 感 器 ， 输 出 是 给 设备 的 控制 信 
号 。 例 如 ， 控 制 汽车 发 动机 的 计算 机 使 用 的 就 是 实时 系统 。 

Pep/8 操作 系统 是 一 个 单 用 户 操 作 系 统 ， 它 展示 了 分 配 CPU wee 
时 间 所 使 用 的 一 些 技术 ， 不 过 它 没有 说 明 主 存 和 磁盘 存储 器 的 管 
理 。 本 章 的 前 两 节 包 含 了 Pep/8 操作 系统 的 完整 代码 。 


8.1 sates 
操作 系统 的 一 个 重要 功能 是 管理 用 户 提交 的 待 执行 作业 。 在 
多 用 户 系统 中 ， 多 个 用 户 不 断 地 提交 作业 ， 操 作 系统 必须 决定 运 


行 待 执行 作业 中 的 哪个 。 在 决定 接 下 来 执行 哪个 作业 后 ， 它 必须 
把 适当 的 程序 装载 到 主 存 并 把 CPU 的 控制 交 给 这 个 程序 来 执行 。 


8.1.1 Pep/8 操作 系统 FC4F 


图 8-1 展示 了 Pep/8 操作 系统 在 主 存 中 的 位 置 。 它 包括 RAM FC57 | man 


0000 





中 的 系统 栈 和 LO 缓冲 区 ， 在 地 址 FC57 处 的 装载 器 ，FC9B 处 的 

中 断 服 务 例 程 和 FFF8 到 FFFE 的 4 个 机 器 向 量 。 虽 然 Pep/8 操 FC9B 
作 系 统 说 明了 装载 器 的 操作 ， 但 是 它 并 没有 说 明 操 作 系 统 决定 运 

行 哪个 待 执行 作业 的 过 程 。 

本 章 讲述 的 操作 系统 是 475 行 汇编 语言 代码 ， 包 括 文档 注 BBE 
释 。 一 般 的 实现 都 是 高 级 语言 和 汇编 语言 混合 写 的 ， 汇 编 语 言 是 FFC | 
针对 该 操作 系统 控制 的 特定 计算 机 的 。 通 常情 况 下 ， 系 统 的 90% SE 
是 高 级 语言 写 的 ，10% 是 汇编 语言 写 的 。 汇 编 语言 部 分 保留 给 操 图 8-1 Pep/8 系统 的 内 存 图 
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作 系 统 中 需要 使 用 高 级 语言 所 没有 的 特性 编程 的 部 件 ， 或 者 那些 对 效率 有 额外 要 求 的 部 件 ， 
而 这 个 要 求 甚至 优化 编译 希 也 不 能 实现 。 

图 8-2 展示 了 Pep/8 操作 系统 的 全 局 常量 和 变量 。 符 号 TRUE 和 FALSE 用 .EQUATE 命 
令 声 明 ， 因 此 不 会 生成 目标 代码 。 它 们 的 使 用 将 贯穿 程序 剩 下 的 部 分 。 

符号 osRAM wordBuff byteBuff wordTemp byteTemp, addrMask 和 opAddr 都 用 .BLOCK 
命令 来 定义 。 通 常情 况 下 ，.BLOCK 生成 代码 ， 且 所 有 生成 的 代码 都 从 0000 (hex) Fto M 
代码 来 看 ， 这 些 .BLOCK 没有 生成 代码 ， 且 osRAM 从 FBCF 开始 而 不 是 0000。 

这 个 奇怪 的 汇编 器 行为 的 原因 在 于 FC57 的 .BURN 命令 。 当 在 程序 中 含有 .BURN 时 ， 
汇编 器 会 假定 该 程序 将 烧 人 RAM， 它 会 为 跟 在 烧 人 指令 后 面 的 指令 生成 代码 ， 而 不 会 为 它 
前 面 的 指令 生成 代码 。 汇 编 器 同时 也 假设 ROM 将 装 在 内 存 底 部 ， 而 把 内 存 的 顶部 留 给 应 用 
程序 使 用 。 因 此 它 计 算 符 号 表 的 地 址 ， 使 得 生成 的 最 后 一 个 字 节 的 地 址 是 烧 入 指令 指定 的 
地 址 。 在 这 段 代 码 中 ， 烧 入 指令 指出 最 后 一 个 字 节 应 该 在 地 址 FFFF 处 。 图 8-16 (JL 8.2.9 
节 ) 显示 最 后 的 字 节 9B (hex) 确实 在 地 址 FFFF ， 在 操作 系统 的 末尾 。 因 为 FFFF (hex) 是 
65536 (dec)， 所 以 Pep/8 计算 机 的 主 存 大 小 配置 为 64KB。 


;大 大 大 xxxx Pep/8 Operating System 


TRUE: .EQUATE 1 
FALSE: . EQUATE 0 


;太太 大 太太 太太 Operating system RAM 

OSRAM: .BLOCK 128 ;System stack area 

wordBuff:.BLOCK 1 ;Input/output buffer 

byteBuff: .BLOCK ;Least significant byte of wordBuff 
wordTemp: .BLOCK ;Temporary word storage 

byteTemp: .BLOCK ;Least significant byte of wordTemp 
addrMask: .BLOCK ;Addressing mode mask 

opAddr: .BLOCK ;Trap instruction operand address 


;大 大 大 大 大 xx Operating system ROM 
.BURN OxFFFF 





图 8-2 Pep/8 操作 系统 的 全 局 常量 和 变量 


8.1.2 ”Pep/8 装载 器 


图 8-3 展示 了 Pep/8 装载 器 。 要 调用 装载 器 ， 就 要 在 仿真 器 上 选择 装载 选项 ， 这 会 触发 
下 面 两 个 事件 : 

SP * Mem[FFFA] 

PC + Mem[FFFC] 
因为 Mem[FFFA] 包含 FC4F， 如 图 8-1 和 图 8-16 所 示 ， 所 以 栈 指 针 被 初始 化 为 FC4F。 类 似 
地 ， 程 序 计数 器 被 初始 化 为 FC57， 即 装载 器 第 一 条 指令 的 地 址 。 

装载 器 先 将 变 址 寄存 器 清 零 ， 再 将 wordBuff 也 清 零 。 图 8-2 显示 wordBuff 声明 为 1 
字 节 。 因 为 wordBuff 后 面 紧 跟 的 byteBuff 声明 为 1 字 节 ， 所 以 程序 把 wordBuff 当 作 
一 个 2 字 节 的 缓冲 区 ，byteBuff 是 它 最 右边 的 字 节 。CHARI 指令 输入 到 byteBuff, 但 后 
面 的 LDA 指令 从 wordBuff kA. LDA 将 输入 的 字符 移动 到 累加 器 ， 并 保证 累加 器 最 左边 
的 字 节 为 零 。 
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; 类 大 大 大 大 大 大 System Loader 
;Data must be in the following format: 
;Each hex number representing a byte must contain 
;exactly two characters. Each character must be 
;in 0..9, A..F, or a..f and must be followed by exactly 
;one space. There must be no leading spaces at the beginning 
:of a line and no trailing spaces at the end of a line. The last two 
;Characters in the file must be lowercase zz, which is used as the 
;terminating sentinel by the loader. 
C80000 loader: LDX 0,7 7X := 0 
E9FC4F STX wordBuff,d ;Clear input buffer word 
49FC50 getChar: CHARI byteBuff,d ;Get first hex character 
C1FC4F LDA wordBuff,d ;Put ASCII into low byte of A 
BOOO7A CPA sory ;If end of file sentinel 'z' 
OAFC9A BREQ stopLoad ;then exit loader routine 
B00039 CPA ae ;If characer <= '9', assume decimal 
06FC72 BRLE shift sand right nybble is correct digit 
700009 ADDA 9,7 ;else convert nybble to correct digit 
1C ASLA ;Shift left by four bits to send 
1G ASLA ;the digit to the most significant 
1C ASLA ;position in the byte 
rC ASLA 
F1FC52 STBYTEA byteTemp,d ;Save the most significant nybble 
49FC50 CHARI byteBuff,d ;Get second hex character 
C1FC4F LDA wordBuff,d ;Put ASCII into low byte of A 
B00039 CPA ;If characer <= '9', assume decimal 
06FC88 BRLE combine sand right nybble is correct digit 
700009 ADDA 9,71 ;else convert nybble to correct digit 
90000F combine: ANDA 0x000F,i ;Mask out the left nybble 
A1FC51 ORA wordTemp,d ;Combine both hex digits in binary 
F50000 STBYTEA 0,x ;Store in Mem[X] 
780001 ADDX t,i ;X := X + 1 
49FC50 CHARI byteBuff,d ;Skip blank or <LF> 
O4FC5D BR getChar 


00 stopLoad:STOP 
图 8-3 Pep/8 操作 系统 的 装载 器 


疫 载 句 是 一 个 单 循 环 的 形式 ， 它 输入 一 个 字符 ， 将 它 和 分 隔 符 z 进行 比较 。 如 果 该 字 
符 不 是 分 隔 符 ， 那 么 程序 检查 它 是 否 属于 '0' ..'9'， 如 果 不 在 这 个 范围 内 ， 那 么 最 右 的 4 
位 ， 通 过 加 9 转换 为 正确 的 值 。4 位 又 称 为 四 位 元 组 (nybble)， 是 半 字 节 。 注 意 ASCII 的 A 
是 0100 0001 (bin)， 因 此 当 它 加 上 9， 和 是 0100 1010， 最 右 的 半 字 节 是 十 六 进 制 数 A 的 正 
确 位 模式 ， 十 六 进 制 的 B 到 F 也 是 类 似 的 情况 。 如 果 字 符 是 在 '0' ..'9' H, 那么 最 右 半 
字 节 已 经 是 正确 的 值 了 。 

aa ST 4 位移 到 左边 ， 临 时 存储 在 byteTemp 中 。 它 输入 第 二 个 字符 ， 类 似 地 
对 半 字 节 进 行 调整 ， 用 FC88 处 的 ANDA 把 两 个 半 字 节 合 成 一 个 字 节 。 把 程序 字 节 放 人 内 存 
的 指令 是 地 址 FC8E 处 的 STBYTEA， 它 使 用 变 址 寻 址 方式 ， 每 次 循环 都 把 变 址 寄存 器 加 1。 
STOP 指令 会 终止 装载 器 ， 将 控制 返回 给 仿真 器 选项 。 

通常 要 装载 的 程序 不 是 十 六 进 制 ASCII 字符 形式 ， 它 们 已 经 是 二 进 制 形 式 ， 准 备 被 装 
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aS. Pep/8 的 目标 文件 使 用 ASCII 字符 ， 因 此 可 以 直接 用 机 器 语言 编程 ， 用 文本 编辑 器 查 
看 目标 文件 。 


8.1.3 ”程序 的 终止 


到 目前 为 止 ， 所 有 出 现 的 应 用 程序 都 是 以 STO 指令 终止 的 。 在 实际 的 计算 机 中 很 少 执 
ÍT STOP 指令 ，C++ 编译 髓 不 会 在 程序 末尾 生成 一 个 STOP 指令 ， 而 是 生成 一 个 把 控制 返回 
操作 系统 的 指令 。 如 果 程 序 运行 在 一 台 个 人 计算 机 上 ， 那 么 操作 系统 会 设置 一 个 屏幕 ， 等 待 
请 求 另 一 个 服务 。 如 果 程 序 运行 在 分 时 共享 系统 上 ， 那 么 操作 系统 会 继续 处 理 其 他 用 户 的 作 
业 。 无 论 哪 种 情况 ， 计 算 机 都 不 会 只 是 简单 地 停 下 来 。 

因为 仅 有 一 个 CPU， 所 以 它 在 执行 操作 系统 作业 和 应 用 作业 之 间 来 回 切换 。 图 8-4 展示 
了 当 操 作 系 统 装 载 和 执行 一 系列 作业 时 CPU 使 用 的 时 间 线 ， 阴 影 部 分 代表 用 在 执行 操作 系 
统 上 的 时 间 。 


Maat 作业 1 Matas 作业 2 Eset 
图 8-4 ” 当 操 作 系 统 加 载 和 执行 一 系列 作业 时 的 CPU 使 用 时 间 线 


操作 系统 代表 执行 业务 的 必要 的 开销 。 当 在 商场 购物 时 ， 购 买 商品 的 价格 不 只 是 反映 商 
品 的 价值 和 运输 到 商场 的 成 本 ， 也 反映 了 售货员 的 薪水 、 商 场 照 明 的 电费 、 商 场 经 理 的 附加 
福利 等 。 类 似 地 ， 计 算 机 资源 并 不 是 100% 地 用 于 执行 用 户 的 程序 ， 一 部 分 的 资源 必须 保留 
给 操作 系统 ， 目 前 我 们 考虑 的 资源 是 CPU 时 间 。 


8.2 陷阱 


XE Asmb5 层 用 汇编 语言 编程 时 ， 可 能 会 用 到 DECI, DECO 和 STRO。 图 4-6 显示 了 在 
ISA3 机 器 层 没 有 这 样 的 指令 ， 取而代之 的 是 ， 当 计算 机 取出 具有 这 样 一 些 操 作 码 (00110 
到 01000 ) 的 指令 时 ， 硬 件 会 执行 陷阱 。 陷 阱 类 似 于 子 程序 转移 ， 但 是 要 更 复杂 一 些 。 执 行 
的 代码 称 为 陷阱 例 程 (trap routine) 或 者 陷阱 处 理 程序 (trap handler) 而 不 是 子 程序 。 操 作 系 统 
通过 执行 从 陷阱 返回 的 指令 RETTR 而 不 是 子 程序 返回 的 指令 RETn 将 控制 交 回 给 应 用 程序 。 

陷阱 处 理 程序 实现 3 条 指令 ， 就 如 同 它 们 是 ISA3 机 器 层 的 一 部 分 一 样 。 记 住 操作 系统 
的 目的 之 一 就 是 向 高 层 编 程 提 供 方 便 的 环境 。Pep/8 操作 系统 提供 的 抽象 机 器 是 一 个 更 加 方 
便 的 机 器 ， 因 为 它 包含 这 3 条 ISA3 层 没有 的 指令 。 除 了 DECI、DECO 和 STRO Jh, HER 
统 还 提供 1 个 非 一 元 和 4 个 一 元 陷阱 指令 ， 叫 作 空 操作 ， 助 记 符 分 别 是 NOP、NOP0、NOP1、 
NOP2 和 NOP3。 当 执行 这 些 指 令 时 什么 都 不 做 ， 提 供 这 些 指令 是 为 了 让 你 能 够 对 它们 重 编 
程 ， 执 行 你 自己 选择 的 新 指令 。 


8.2.1 陷阱 机 制 
下 面 是 陷阱 指令 的 寄存 器 传输 语言 (RTL) 描述 : 
Temp < Mem[FFFA]; 
Mem[Temp - 1] TR 0.7 } 3 
Mem[Temp - 3] += SPs 


Mem|[Temp - 5] += POS 
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Mem[Temp - 7] aa 
Mem[Temp - 9] <— A; 
Mem[Temp - 10] ¢ 4..7) = NZNC: 

SP <— Temp — 10; 
PC <— Mem[FFFE] 


为 了 表述 方便 ，Temp 表示 临时 值 。Mem[FFFA] 包含 FC4F， 即 系统 栈 的 地 址 。 在 第 一 
个 操作 中 ，Temp 获得 FC4F ， 接 下 来 的 6 个 操作 显示 CPU 把 所 有 寄存 占 的 内 容 都 压 人 系统 
Re, MIR 指令 指示 符 开 始 ， 到 NZVC 标记 位 结束 。 接 着 栈 指针 被 修改 为 指向 新 的 系统 栈 顶 


部 ， 程 序 计数 器 获得 Mem[FFFE] 的 内 容 。 
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图 8-5 展示 了 像 图 5-11 那样 陷阱 的 例子 。 图 5-11 中 的 程序 包含 下 面 的 十 进 制 输出 陷阱 


0029 390003 DECO 0x0003,d ;Output the sum 


这 里 的 0029 是 该 指令 的 地 址 ，390003 是 执行 中 触发 该 陷阱 的 目标 代码 。 


CPU 





a) 陷阱 指令 之 前 b) 陷阱 指令 之 后 
图 8-5 执行 DECO 陷阱 指令 390003 触发 的 陷阱 


图 8-5a 展示 了 陷阱 执行 前 CPU 的 状态 ， 图 8-5b 是 陷阱 执行 后 的 状态 。 可 以 看 到 只 有 
IR 的 指令 指示 符 部 分 被 压 和 人 栈 ， 还 可 以 注意 到 4 个 NZVC 位 正好 位 于 Mem[FC45] 处 字 节 的 
右 半 部 分 中 ， 该 字 节 的 左 半 字 节 未 定义 。SP 的 值 是 FC45， 即 新 系统 栈 的 顶部 ，PC 的 内 容 
是 Mem[FFFE]， 即 陷阱 处 理 程序 第 一 条 指令 的 地 址 FC9B。 图 8-16 (IL 8.2.9 节 ) 展示 了 操 
作 系 统 怎 样 用 .ADDRSS 命令 在 地 址 FFFA 和 FFFE 设置 机 器 向 量 。 


8.2.2 RETTR 指令 


执行 时 的 程序 叫 作 进程 (process)。 陷 阱 机 制 临 时 终止 一 个 进程 ， 这 样 操作 系统 可 以 执 
行 服务 。 主 存 中 包含 被 陷阱 进程 寄存 器 副本 的 信息 块 叫 作 进 程控 制 块 (PCB)。 这 个 例子 的 
PCB 存储 在 Mem[FC45] 到 Mem[FC4F] 中 ， 如 图 8-5b 所 示 。 

操作 系统 执行 完 它 的 服务 后 ， 最 后 必须 把 CPU 的 控制 交 回 给 被 挂 起 的 进程 ， 这 样 该 进 
程 可 以 继续 完成 执行 。 在 这 个 例子 中 ，Pep/8 操作 系统 执行 的 服务 是 执行 DECO 指令 。 操 作 
系统 通过 执行 陷阱 返回 指令 RETTR 将 控制 交 回 给 进程 。 

RETTR 的 RTL 描述 是 

NZVC < Mem[SP] ¢4..7) ; 

A <— Mem[SP + 1]; 


X < Mem[SP + 3]; 

PC <— Mem[SP + 5]; 

SP < MemfSP + 7]; 
RETTR 把 最 上 面 的 9 个 字 节 弹出 栈 放 入 NZVC、A、X、PC 和 SP 寄存 器 中 。 除 了 不 弹出 IR 
外 ， 它 的 操作 顺序 刚好 和 陷阱 操作 的 顺序 相反 。 下 一 条 要 执行 的 指令 将 是 新 PC 的 值 指定 的 
指令 。 最 后 修改 的 寄存 器 是 SP。 

如 果 陷 阱 处 理 程序 不 修改 PCB 中 的 任何 值 ， 那 么 当 进程 重新 开始 时 ，RETTR 将 恢复 CPU 
寄存 器 的 原始 值 。 尤 其 是 SP， 就 像 在 处 理 陷 阱 时 一 样 ， 将 重新 指向 应 用 程序 栈 的 顶部 。 另 一 
方面 ， 陷 阱 处 理 程序 对 PCB 中 值 的 任何 改变 ， 在 进程 重新 开始 时 ， 都 会 反映 在 CPU 寄存 器 中 。 


8.2.3 ”陷阱 处 理 程 序 


8-6 展示 了 陷阱 处 理 程序 的 进入 点 和 退出 点 。o1dIR 是 根据 陷阱 机 制 存 储 在 系统 栈 上 
的 IR Ay FF as al AS AY Be HE, K 8-7a 展示 了 所 有 寄存 器 的 栈 地 址 。 


3 六 大 六 类 大 二 handler 
oldIR: .EQUATE 9 ;Stack address of IR on trap 


C80000 trap: LDX 0,7 ;Clear X for a byte compare 

DB0009 LDBYTEX oldIR,s ;X := trapped IR 

B80028 CPX 0x0028,i ;If X >= first nonunary trap opcode 
OEFCB7 BRGE nonUnary ;trap opcode is nonunary 


980003 ANDX 0x0003,i ;Mask out all but rightmost two bits 
1D ASLX ;An address is two bytes 

LAEGAE CALL unaryJT,x ;Call unary trap routine 

01 RETTR ;Return from trap 


FDB6 unaryJT: .ADDRSS opcode24 ;Address of NOPO subroutine 
FDB7 .ADDRSS opcode25 ;Address of NOP1 subroutine 
FDB8 .ADDRSS opcode26 ;Address of NOP2 subroutine 
FDB9 .ADDRSS opcode27 ;Address of NOP3 subroutine 


it nonUnary:ASRX ;Trap opcode is nonunary 

LF ASRX ;Discard addressing mode bits 
1F ASRX 

880005 SUBX S44 ;Adjust so that NOP opcode = 0 
1D ASLX ;An address is two bytes 
17FCC2 CALL nonUnJT,x ;Call nonunary trap routine 

01 return: RETTR ;Return from trap 


FDBA nonUnJT: .ADDRSS opcode28s ;Address of NOP subroutine 
FDC4 -ADDRSS opcode30 ;Address of DECI subroutine 
FF3B -ADDRSS opcode38 ;Address of DECO subroutine 
FFC6 .ADDRSS opcode40 ;Address of STRO subroutine 


图 8-6 Pep/8 操作 系统 中 陷阱 处 理 程序 的 进入 点 和 退出 点 


当 执 行 一 条 陷阱 指令 时 ， 下 一 条 要 执行 的 指令 在 FC9B ， 即 图 8-6 中 的 第 一 条 指令 。 下 
面 任何 一 条 指令 都 能 触发 陷阱 : 

0010 Olnn, NOPn, — 7 X 4 4 K H 

0010 laaa, NOP， 非 一 元 空 操 作 陷 阱 
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0011 0aaa，DECI， 非 一 元 十 进 制 输入 陷阱 
0011 laaa，DEC0O， 非 一 元 十 进 制 输出 陷阱 
0100 0aaa，STRO， 非 一 元 输出 串 输出 陷阱 





a) 陷阱 刚刚 发 生 后 b) 栈 顶 有 两 个 返回 地 址 。 阴 影 部 分 是 PCB 
图 8-7 CPU 寄存 器 副本 的 栈 地 址 


图 8-6 中 的 代码 确定 哪 一 条 指令 触发 了 陷阱 ， 并 调用 实现 这 条 指令 的 特定 处 理 程序 。 总 
共有 8 个 陷阱 处 理 程序 ， 一 元 NOPn 指令 有 4 个 ， 非 一 元 指令 有 4 个 。 记 住 汉 - 诺 依 曼 循 环 
的 取 指 部 分 是 把 指令 指示 符 放 在 指令 寄存 器 中 。 陷 阱 发 生 后 ， 引 发 陷阱 的 指令 的 指令 指示 符 
可 以 从 系统 栈 上 获取 ， 因 为 根据 陷阱 机 制 ， 它 被 压 到 了 栈 上 。 图 8-6 中 的 代码 访问 被 保存 的 
指令 指示 符 来 确定 哪 一 条 指令 触发 了 该 陷阱 。 

”在 图 8-6 中 第 一 条 指令 从 被 压 人 系统 栈 的 IR 副本 获取 操作 码 。NoP 指令 有 第 一 个 非 一 
元 操作 码 0010 laaa, H 0010 1000 (bin) 等 于 28 (dec), Hott FCA 处 的 CPX 指令 将 陷阱 代 
码 和 28 (dec) 进行 比较 ， 如 果 陷 阱 代码 小 于 28， 那 么 该 陷阱 指令 是 一 元 的 ， 否 则 是 非 一 元 的 。 

如 果 陷 阱 指令 是 一 元 指令 ， 那 么 它 必定 是 下 列 4 条 指令 之 一 : 

0010 0100，NOP0， 最 右 2 位 是 00 

0010 0101，NOP1， 最 右 2 位 是 01 

0010.0110，NOP2， 最 右 2 位 是 10 

0010 0111，NOP3， 最 在 2 位 是 11 
地 址 FCA7 的 ANDX 指令 将 屏蔽 除了 最 右 2 位 外 的 所 有 位 ， 这 2 位 就 足以 确定 4 条 指令 中 的 
哪 条 引发 了 该 陷阱 。 地 址 FCAB 的 CALL 指令 使 用 图 6-40 中 程序 描述 的 采用 变 址 寻 址 的 转 
移 表 技术 。 图 6-40 展示 了 编译 器 怎样 用 无 条 件 转移 指令 BR 和 地 址 数组 来 翻译 C++ 的 switch 
Wajo BI 8-6 的 代码 和 图 6-40 的 代码 稍 有 不 同 ， 因 为 它 使 用 了 CALL 而 不 是 BR, 但 原理 是 一 
样 的 。 地 址 FCAF 的 转移 表 是 一 个 地 址 数组 ， 数 组 中 的 每 个 元 素 是 触发 该 陷阱 的 特定 指令 的 
陷阱 处 理 程序 的 第 一 条 语句 的 地 址 。 因 为 执行 CALL， 所 以 它 把 返回 地 址 压 人 栈 中 。 在 一 个 特 
定 的 陷阱 处 理 程 序 中 ， 最 后 执行 的 指令 是 RET0， 它 将 控制 返回 到 FCAE。 地 址 FCAE 处 的 
指令 是 RETTR， 它 从 PCB 恢复 CPU 寄存 器 ， 把 控制 返回 该 陷阱 指令 后 面 的 那 条 指令 。 

对 所 有 的 非 一 元 指令 ， 从 FCB7 到 FCC8 的 指令 做 一 样 的 事情 。3 个 ASRX 指令 丢弃 寻 
址 模式 位 ，SUBX 指令 进行 调整 ， 把 变 址 寄存 器 的 内 容 变 为 

0， 如 果 陷 阱 IR 包含 0010 laaa, NOP 

1， 如 果 陷 阱 IR @ 0011 Oaaa, DECI 

2， 如 果 陷 阱 IR 包含 0011 laaa, DECO 
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3, 如 果 陷 阱 IR 包含 0100 Oaaa, STRO 

与 一 元 指令 一 样 ， 地 址 FCBE 处 的 CALL 会 跳 转 到 某 条 特定 指令 的 陷阱 处 理 程序 。 陷 阱 
处 理 程序 执行 完 该 指令 后 ， 会 把 控制 返回 到 地 址 FCC1 处 的 RETTR 指令 ，RETTR 接着 把 控 
制 交 回 给 触发 该 陷阱 的 指令 后 面 的 那 条 指令 。 


8.2.4 陷阱 寻 址 方式 断言 


不 同 的 指令 有 不 同 的 寻 址 方式 。 例 如 ， 图 5-2 说 明 CHARI 指令 不 能 用 立即 数 寻 址 ， 而 
STRO 指令 允许 用 直接 、 间 接 和 栈 相 对 间接 寻 址 。 因 为 CHARI 指令 是 固化 到 CPU 中 的 ， 所 
以 由 硬件 检测 是 否 发 生 了 寻 址 错误 。 但 是 陷阱 指令 ， 例 如 STRO0， 不 是 CPU RÆK, KHA 
理 程序 用 软件 来 实现 它们 。 那 么 问题 来 了 ， 陷 阱 处 理 程序 怎样 检测 陷阱 指令 是 否 试图 使 用 非 
法 的 寻 址 方式 呢 ? 答案 是 使 用 图 8-8 中 的 寻 址 方式 断言 例 程 。 


;*xxkkkA* Assert valid trap addressing mode 

OldIR4: .EQUATE 13 ;01dIR + 4 with two return addresses 
C00001 assertAd:LDA l;i :大 := 1 
DBOOOD LDBYTEX oldIR4,s ;X := O1dIR 
980007 ANDX 0x0007,i ;Keep only the addressing mode bits 
OAFCDD BREQ testAd ;000 = immediate addressing 
1C loop: ASLA ;Shift the 1 bit left 
880001 SUBX i ;Subtract from addressing mode count 
OCFCD6 BRNE loop ;Try next addressing mode 
91FC53 testAd: ANDA addrMask,d ;AND the 1 bit with legal modes 
OAFCE4 BREQ addrerr 
58 RETO ;Legal addressing mode, return 
50000A addrErr: CHARO "An yi 
COFCF4 LDA trapMsg,i ;Push address of error message 
ESFFFE STA “26S 
680002 SUBSP 2,i ;Call print subroutine 
16FFE2 CALL prntMsg 
00 STOP Halt: Fatal runtime error 
455252 trapMsg: .ASCII “ERROR: Invalid trap addressing mode. \x00" 





图 8-8 Pep/8 操作 系统 中 的 陷阱 寻 址 方式 断言 


寻 址 方式 断言 例 程 必须 访问 存储 在 系统 栈 上 的 陷阱 IR。 陷 阱 发 生 后 ，IR 的 栈 地 址 是 9， 
如 图 8-7a 所 示 。 不 过 ， 到 调用 陷阱 寻 址 方式 时 ， 系 统 栈 顶 又 增加 了 两 个 返回 地 址 ， 一 个 地 
址 来 自 图 8-6 的 陷阱 处 理 程序 代码 中 的 CALL 指令 ， 一 个 地 址 来 自 于 特定 陷阱 处 理 程 序 中 的 
CALL。 图 8-7b 展示 了 寻 址 方式 断言 例 程 被 调用 后 系统 栈 上 的 PCB 和 栈 上 的 两 个 返回 地 址 。 
陷阱 IR 的 栈 地 址 现在 是 13 而 不 是 9， 因为 两 个 返回 地 址 占用 了 4 字 节 。 

图 8-8 中 的 例 程 有 如 下 前 提 和 后 置 条 件 : 

© 前 提 条 件 : addrMask 是 位 掩 码 ， 表 示人 允许 的 寻 址 方式 集合 ， 栈 指令 的 PCB 在 系统 栈 上 。 

e 后 置 条 件 : 如 果 陷 阱 指令 的 寻 址 方式 在 允许 的 寻 址 方式 集合 中 ， 那 么 控制 就 交 回 给 

陷阱 处 理 程序 ， 否则 输出 无 效 寻 址 方式 信息 ， 程 序 中 止 于 致命 运行 时 错误 。 

寻 址 方式 断言 例 程 是 某 些 HOL6 语言 as sert 语句 的 Asmb5 版 本 。 在 C++ HP, ba 
关 的 功能 在 <asseret> 库 中 ， 可 以 在 程序 中 用 #include 编译 占 指 令 包 含 这 个 库 。 

陷阱 处 理 程 序 使 用 断言 例 程 ， 首 先 如 图 8-2 中 地 址 FC53 所 示 设 置 全 局 变量 addrMask 
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的 值 ， 使 之 表示 这 条 指令 允许 的 寻 址 方式 ， 接 着 如 图 8-8 中 地 址 FCCA 所 示 调 用 
assertAd。 上 断言 例 程 假 定 使 用 一 种 称 为 位 图 表示 的 、 常 用 的 集合 表示 法 。 在 机 器 语言 
每 位 的 值 为 0 或 者 1。 人 允许 寻 址 方式 集合 的 位 图 表示 将 一 种 寻 址 方式 和 addrMask 中 的 一 _ 位 
对 应 ， 如 果 该 位 是 0， 那 么 相对 应 的 寻 址 方式 就 不 在 集合 中 ， 如 果 某 位 的 值 为 1， 那 么 对 应 
的 寻 址 方式 在 集合 中 。 
图 8-9 展示 了 STRO 指令 的 陷阱 处 理 程序 预先 

设置 好 的 addrMask 最 右 的 一 个 字 节 ， 该 指令 允许 Dogancrn 
使 用 直接 、 间 接 和 栈 相 对 间接 寻 址 方式 。 这 几 种 寻 


= 


DA: 
址 方式 对 应 的 位 值 为 1， 其 他 位 为 0。 从 数学 上 说 ， 
这 个 掩 码 代表 了 集合 { 直接 ， 间 接 ， 栈 相对 间接 }。 

为 了 说 明 图 8-8 中 的 断言 例 程 怎 样 测试 集合 i 
ge 假定 STRO 指令 用 栈 相 对 间接 寻 址 来 执 ssa 

， 这 样 它 的 寻 址 字段 就 是 100， 这 是 一 个 被 允 
a 首先 ， 地 址 FCCA 的 LDA 语句 把 ai 
累加 器 的 最 右 一 个 字 节 置 为 0000 0001， 接 下 来 的 ORSI 
两 条 语句 根据 陷阱 指令 的 寻 址 -aaa 字段 把 变 址 寄 BRE 
FAREN 4 (dec)。 接 着 循环 从 4 开始 倒数 循环 到 图 8-9 addressMaks 中 的 位 对 应 的 STRO 
0， 每 次 循环 就 把 累加 器 中 的 那个 1 位 往 左 移动 一 陷阱 指令 允许 的 地 址 寻 址 方式 


位 ， 累 加 器 最 后 的 值 是 0001 0000， 这 个 1 位 就 在 对 应 于 栈 相 对 间接 寻 址 的 那个 位 置 。 
FCCD 的 ANDA 语句 将 图 8-9 的 寻 址 掩 码 与 累加 需 进 行 AND 运算 ， 因 为 从 右 数 第 5 po 
1， 所 以 结果 为 非 零 ， 控 制 返回 到 陷阱 处 理 程序 。 如 果 不 允 许 使 用 栈 相对 间接 寻 址 ， 那 么 寻 址 掩 
码 从 右 数 的 第 5 位 是 0，AND 运算 的 结果 是 0， 于 是 断言 失败 。 


8.2.5 ”陷阱 操作 数 地 址 计算 


陷阱 操作 数 地 址 计算 是 非 一 元 陷阱 处 理 程序 调用 的 另 一 个 例 程 。 原 生 指 令 的 寻 址 方式 是 
固化 到 CPU 的 ， 但 是 陷阱 指令 以 软件 而 不 是 硬件 的 方式 实现 ， 因 此 必须 用 软件 方式 来 模拟 
8 种 寻 址 方式 。 图 8-10 展示 了 执行 这 个 计算 的 例 程 。 


;大 大 大 炎炎 x 文 Set address of trap operand 


oldX4: EQUATE. 7 ;01dX + 4 with two return addresses 
OldPC4: .EQUATE 9 ;01dPC + 4 with two return addresses 
oldSP4: .EQUATE 11 ;01dSP + 4 with two return addresses 

FD19 DBOOOD setAddr: LDBYTEX oldIR4,s ;X := old instruction register 

FD1C 980007 ANDX 0x0007,7 ;Keep only the addressing mode bits 

FDIF ID ASLX ;An address is two bytes 

FD20 O5FD23 BR addrJT,x 

FD23 FD33 addrJT: .ADDRSS addrI ; Immediate addressing 

FD25 FD3D .ADDRSS addrD ;Direct addressing 

FD27 FD4A .ADDRSS addrN ;Indirect addressing 

FD29 FD5A .ADDRSS addrS ;Stack-relative addressing 

FD2B FD6A .ADDRSS addrSF ;Stack-relative deferred addressing 

FD2D FD7D .ADDRSS addrx ;Indexed addressing i 

FD2F FD8D -ADDRSS addrSX ;Stack-indexed addressing 

FD31 FDAO -ADDRSS addrSXF ;Stack-indexed deferred addressing 


图 8-10 Pep/8 操作 系统 中 陷阱 操作 数 地 址 计算 


CB0009 
880002 
E9FC55 
58 


CB0009 
880002 
CD0000 
E9FC55 
58 


CB0009 
880002 
CD0000 
CD0000 
E9FC55 
58 


CB0009 
880002 
CD0000 
7B000B 
E9FC55 
58 


CB0009 
880002 
CD0000 
7B000B 
CD0000 
E9FC55 
58 


CB0009 
880002 
CD0000 
7B0007 
E9FC55 
58 


CB0009 
880002 
cD0000 
780007 
780008 
E9FC55 


58 
CB0009 


880002 
CD0000 
780008 
cD0000 
780007 
E9FC55 
58 


addrI: 


addrSF: 


addrSx: 


addrSXF: 


LDX oldPC4,s ;Immediate addressing 


;Oprnd = OprndsSpec 


SUBX 2,7 
opAddr,d 


STX 
RETO 


oldPC4,s :Direct addressing 

2 ;Oprnd = Mem[OprndSpec] 
0X 

opAddr,d 


oldPC4,s ;Indirect addressing 

Cai ;Oprnd = Mem[Mem[0prndSpec]] 
0,x 

0,x 

opAddr,d 


oldPC4,s ;Stack-relative addressing 
2,4 ;Oprnd = Mem[SP + OprndSpec] 
0,x 

o1dSP4,s 

opAddr,d 


oldPC4,s ;Stack-relative deferred addressing 
2,1 ;Oprnd = Mem[Mem[SP + OprndSpec]] 

0 ,X 

oldSPp4,s 

0X 

opAddr,d 


oldPC4,s ;Indexed addressing 

2 ;Oprnd = Mem[OprndSpec + X] 
0,x 

oldX4,s 

opAddr,d 


oldPC4,s ;Stack-indexed addressing 

21 ;Oprnd = Mem[SP + OprndSpec + X] 
0x 

01dX4,S 

oldSP4,s 

opAddr,d 


oldPC4,s ;Stack-indexed deferred addressing 
Cat ;Oprnd = Mem[Mem[SP + OprndSpec] + X] 
9 X 

oldSP4,s 

0,x 

oldX4,s 

opAddr,d 





图 8-10 (2%) 


图 8-10 的 例 程 有 下 列 的 前 提 和 后 置 条 件 : 
e 前 提 条 件 : 栈 指令 的 PCB 在 系统 栈 上 。 


YA 
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e 后 置 条 件 : opAddr 包含 根据 陷阱 指令 的 寻 址 方式 计算 的 操作 数 地 址 。 

与 图 8-8 中 寻 址 方式 断言 例 程 一 样 ，PCB 中 寄存 器 副本 的 栈 偏 移 量 比 陷阱 刚 发 生 时 大 
了 4 字 节 ， 如 图 8-7b 所 示 。 这 个 例 程 用 寻 址 方式 断言 例 程 中 定义 的 o1dIR4， 类 似 的 还 有 
01dX4, o1dPC4 和 ol1dSP4， 分 别 来 访问 保存 的 寄存 器 副本 、 程 序 计 数 器 和 栈 指 针 。 

从 FD19 开始 的 前 4 条 指令 确定 陷阱 指令 的 寻 址 方式 ， 并 转移 到 该 种 寻 址 方式 对 应 的 计 
算 ， 使 用 的 是 转移 表 技 术 在 8 种 可 能 性 中 进行 选择 。8 种 选择 中 每 一 个 的 代码 都 通过 检查 陷 
阱 发 生 时 CPU 的 状态 来 计算 操作 数 的 地 址 。 

每 个 计算 的 前 两 条 指令 都 是 


LDX oldPC4,s 
SUBX 2 ,i 


因为 陷阱 指令 是 非 一 元 的 ， 所 以 陷阱 发 生 时 程序 计数 器 指向 2 字 节 操作 数 指示 符 后 面 的 那个 
字 节 。 第 一 条 指令 把 保存 的 程序 计数 器 装载 到 变 址 寄存 器 ， 第 二 条 指令 将 它 减 去 2。 这 两 条 
指令 执行 后 ， 变 址 寄存 器 包含 引发 陷阱 的 指令 中 的 操作 数 指 示 符 的 地 址 。 

对 于 立即 数 寻 址 ， 操 作 数 指示 符 就 是 操作 数 ， 因 此 地 址 FD39 的 语句 


STX opAddr,d 
RETO 


只 是 如 要 求 的 那样 把 操作 数 指示 符 的 地 址 存储 到 opAddr Fo 
对 于 直接 寻 址 ， 操 作 数 指示 符 是 操作 数 的 地 址 ， 地 址 FD43 开始 的 语句 


LDX O,x 
STX opAddr,d 
RETO 


中 的 第 一 条 用 变 址 寄存 器 中 地 址 所 指向 内 存 的 内 容 蔡 换 变 址 寄存 器 。 在 指令 执行 前 ， 变 址 寄 
存 器 包含 的 是 操作 数 指示 符 的 地 址 ， 在 指令 执行 后 ， 变 址 寄存 器 包含 的 是 操作 数 指示 符 本 
身 。 因 为 操作 数 指示 符 是 操作 数 的 地 址 ， 所 以 就 把 它 存储 在 opAddr 中 。 

对 于 间接 寻 址 ， 操 作 数 指示 符 是 操作 数 地 址 的 地 址 。 和 直接 寻 址 一 样 ， 地 址 FD50 开始 
的 语句 

LOX: ‘0.x 

LDX 0,x 


STX opAddr,d 
RETO 


中 的 第 一 条 用 操作 数 指示 符 替 换 变 址 寄存 器 的 内 容 ， 即 操作 数 地 址 的 地 址 。 第 二 条 语句 获取 
操作 数 的 地 址 ， 存 储 在 opAddr 中 。 
对 于 栈 相 对 寻 址 ， 栈 指针 加 上 操作 数 指示 符 等 于 操作 数 的 地 址 。 地 址 FD60 开始 的 语句 


LDX 0,x 

ADDX oldSP4,s 
STX opAddr,d 
RETO 


PHR ARSE BG as FF Hi a EL A eee, OAC IEE IER MAA, SRB 
是 操作 数 的 地 址 ， 将 其 存储 在 opAddr 中 。 

剩 下 的 4 种 寻 址 方式 用 类 似 的 技术 来 计算 操作 数 的 地 址 。 栈 相对 间接 寻 址 比 栈 相 对 寻 址 
多 一 层 间 接 的 过 程 ， 要 求 多 执行 一 条 LDX 0,x。 除 了 把 操作 数 指示 符 而 不 是 栈 指针 加 到 变 
址 寄存 器 上 以 外 ， 变 址 寻 址 和 栈 相 对 寻 址 是 一 样 的 。 栈 变 址 和 栈 变 址 间接 寻 址 也 都 是 类 似 的 
变换 。 
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8.2.6 ” 空 操作 陷阱 处 理 程序 


图 8-11 展示 了 执行 空 操 作 陷 阱 处 理 程序 的 代码 。 因 为 NOP 指令 不 做 任何 事情 ， 所 以 陷 
阱 处 理 程序 除了 执行 RET0 把 控制 返回 图 8-6 的 出 口 点 并 最 终 返 回 给 陷阱 语句 后 面 的 语句 
外 ， 不 做 任何 其 他 处 理 。 

提供 NOP 指令 是 为 了 人 允许 我 们 编写 自己 的 陷阱 处 理 程序 。 本 章 末 尾 的 一 些 问题 会 让 你 
实现 一 些 Pep/8 指令 集中 没有 的 指令 。Pep/8 汇编 器 让 你 重新 定义 陷阱 指令 的 助 记 符 。 要 写 
一 个 陷阱 处 理 程序 ， 把 图 8-11 中 的 一 个 NOP 指令 的 助 记 符 变 成 新 指令 的 助 记 符 ， 接 着 编辑 
操作 系统 中 的 陷阱 处 理 程序 ， 在 入 口 点 插入 你 的 代码 。 例 如 ， 要 重新 定义 NOP0， 在 FDB6 
插入 你 的 处 理 程 序 的 代码 。 处 理 程序 最 后 一 条 可 执行 语句 应 该 是 RET0。 

sueeRERE OpCOde 0X24 


:The NOPO instruction. 
opcode24: RETO 


;太太 太太 大 太太 Qncode 0x25 
;The NOP1 instruction. 
opcode25:RETO 


skekekke Qnocode 0x26 
;The NOP2 instruction. 
opcode26:RETO 


skREKEER Oncode 0x27 
;The NOP3 instruction. 
opcode27:RETO 


:大大 二 大大 类 大 Oncode 0x28 
;The NOP instruction. 
C00001 opcode28:LDA 0x0001,i ;Assert i 
EIFCS3 STA addrMask,d 
16FCCA CALL assertAd 
58 RETO 


图 8-11 NOP 陷阱 处 理 程序 


图 8-11 展示 了 地 址 FDBA 处 的 非 一 元 NOP 的 实现 。 图 5-2 说 明了 它 唯 一 允许 的 寻 址 方 
式 是 立即 数 寻 址 ， 因 此 addrMask 的 值 被 置 为 0000 0001， 这 里 最 后 的 1 所 在 的 位 对 应 于 立 
即 数 寻 址 ， 如 图 8-9 所 示 。 


8.2.7 DECI 陷阱 处 理 程序 


图 8-14 是 DECI 指令 的 陷阱 处 理 程序 。DECI 必须 对 输 
入 进行 语法 分 析 ， 把 ASCII 字符 串 转换 成 适当 的 补 码 表示 
的 位 。 它 使 用 图 8-12 的 有 限 状 态 机 (FSM)， 而 图 8-13 是 
DECI 陷阱 处 理 程序 的 FSM 的 逻辑 框架 , state 是 枚 举 类 型 ， 
可 能 的 值 是 init、sign 或 digit。 

在 图 8-14 中 ， 从 地 址 FDC4 开始 的 4 条 语句 调用 寻 址 方 
式 断 言 例 程 和 计算 陷阱 操作 数 地 址 例 程 。 在 地 址 FDD0， 处 图 8-12 DECI 中断 处 理 程序 中 
理 程 序 在 栈 上 分 配 了 6 个 局 部 变量 一 一 total、valAscii、 的 有 限 状 态 机 
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isOvfl, isNeg, state 和 temp， 每 个 变量 占 2 字 节 ， 为 此 SUBSP 将 栈 指针 减 去 12。 对 
于 应 用 程序 来 说 ，SUBSP 是 程序 中 第 一 条 使 用 局 部 变量 的 可 执行 语句 ，SUBSP 必须 在 前 面 
两 个 程序 调用 之 后 执行 ， 因 为 这 两 个 调用 会 访问 来 自 PCB 的 数据 ， 它 们 假定 栈 上 只 有 两 个 
返回 地 址 ， 如 图 8-7b 所 示 。 

DECI 陷阱 处 理 程 序 必须 通过 PCB 访问 NZVC 位 。 地 址 FCBE AY CALL 指令 调用 此 处 
HEJ, CALL 指令 把 2 字 节 的 返回 地 址 压 人 栈 。 当 处 理 程序 访问 陷阱 发 生 时 存储 在 栈 上 的 
NZVC 值 时 ， 由 于 局 部 变量 和 返回 地 址 的 原因 ， 所 以 它 的 栈 地 址 将 比 陷 阱 刚刚 发 生 后 大 14。 
这 就 是 为 什么 老 的 NZVC 等 于 14 而 不 是 0。 


isOvfl := false 
state := init 
do 
CHARI asciiCh 
Switch state 
case init: 
if (asciiCh == '+') { 
isNeg := false 
state := sign 
} 
else if (asciiCh == '-' 
isNeg := true 
State := sign 
} 
else if (asciiCh isadigit) { 
isNeg := false 
total := Value (asciiCh) 
state := digit 
} 
else if (asciiCh isnot <SPACE> or <LF>) { 
Exit with DECI error 
} 
case sign: 
if (asciiCh isadigit) { 
total := Value (asciiCh) 
state := digit 
} 
else { 
Exit with DECI error 
} 
case digit: 
if (asciiCh isadigit) { 
total := 10 * total + Value (asciiCh) 
if (overflow) { 
isOvfl := true 
} 
} 
else { 
Fxit normally 
} 
end switch 
while (not exit) 


图 8-13 DECI 陷阱 处 理 程 序 的 程序 逻辑 





大 大友 大 大 二 0pcode 0x30 

:The DECI instruction. 

;Input format: Any number of leading spaces or line feeds are 
;allowed, followed by ‘+’, '-', or a digit as the first character, 
;after which digits are input until the first nondigit is 
;encountered. The status flags N, Z, and V are set appropriately 
;by this DECI routine. The C status flag is not affected. 


OldNZVC: .EQUATE ;Stack address of NZVC on interrupt 


total: 
valAscii: 
isOvfl: 
isNeg: 
state: 
temp: 


. EQUATE 
. EQUATE 
. EQUATE 
. EQUATE 
. EQUATE 
. EQUATE 


;Cumulative total of DECI number 
;Value(asciiCH) 

;Overflow boolean 

;Negative boolean 

;State variable 


. EQUATE 
EQUATE 1 
. EQUATE 2 


Enumerated values for state 


init: 
sign: 
digit: 


LDA 
STA 
CALL 
CALL 
SUBSP 
LDA 
STA 
LDA 
STA 
LDA 
STA 


0x00FE , i 
addrMask,d 
assertAd 
setAddr 

i ae 
FALSE,.1 
isOvfl,s 
init,i 
state,s 
0,7 
wordBuff,d 


COOOFE opcode30: ;Assert d, n, S, 
E1FC53 
16FCCA 
16FD19 
68000C 
C00000 
E30006 
C00000 
E30002 
C00000 


E1FC4F 


;Set address of trap operand 
:Allocate storage for locals 
;isOvfl := FALSE 


;State := init 


;wordBuff := 0 for input 


49FC50 
C1FC4F 
90000F 
E30008 
C1FC4F LDA 
CB0002 LDX 
1D ASLX 
05FDFB BR 


stateyT: 


CHARI 
LDA 
ANDA 
STA 


byteBuff,d 
wordBuff,d 
0x000F ,i 
valAscii,s 
wordBuff,d 
state,s 


;Get asciiCh 
:Set value(asciiCH) 


;A = asciiCh throughout the loop 
;Switch (state) 

;An address is two bytes 
stateJT,x 


FEO] 
FE5B 
FE76 


-ADDRSS sInit 
.ADDRSS sSign 
-ADDRSS sDigit 


80002B sInit: el sif CasctiCh == *+*) 


OCFE16 
C80000 
EB0004 
C80001 
EB0002 
04FDE5 


B0002D ifMinus : 


0CFE2B 


ifMinus 
FALSE, i 
isNeg,s 
sign,i 
state,s 
do 


a 
ifDigit 





:isNeg := FALSE 


;State := sign 


:else if (asciiCh == '-') 


图 8-14 DECI 陷阱 处 理 程序 
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FEIC 
PELF 
FE22 
FE25 
FE28 


FE2B 
FE2E 
FES! 
FE34 
FE37 
FE3A 
FE3D 
FE40 
FE43 
FE46 
FE49 


FE4C 
FE4F 
FE52 
FESS 
FE58 


FE5B 
FESE 
FE61 
FE64 
FE67 
FE6A 
FE6D 
FE70 
FE73 


FE76 
FE79 
rE7C 
FE7F 
FE82 
FE85 
FE88 
FE89 
FE8C 
FE8F 
FE92 
FE95 
FE96 
FESS 
FESC 
FE9F 
FEAO 
FEA3 
FEA6 
FEA9 


C80001 
EB0004 
C80001 
EB0002 
04FDE5 


B00030 
08FE4C 
B00039 
10FE4C 
C80000 
EB0004 
CB0008 
EB000A 
C80002 
EB0002 
04FDE5 


B00020 
OAFDE5 
BOOOOA 
OCFF11 
O4FDE5 


B00030 
08FF11 
800039 
10FF11 
CB0008 
EB000A 
C80002 
EB0002 
04FDE5 


B00030 
08FEC7 
B00039 
10FEC7 
C80001 
C3000A 
1C 

12FE8F 
04FE92 
EB0006 
E30000 
16 

12FE9C 
04FE9F 
EB0006 
1C 

12FEA6 
04FEA9 
EB0006 
730000 


ifDigit: 


ifWhite: 


sSign: 


sDigit: 


ovfll: 
L1: 


ovfl2: 
L2: 


ovfl3: 
L3: 


LDX 
STX 
LDX 
STX 
BR 


CPA 
BRLT 
CPA 
BRGT 
LDX 
STX 
LDX 
STX 
LDX 
STX 
BR 


CPA 
BREQ 
CPA 
BRNE 
BR 


CPA 
BRLT 
CPA 
BRGT 
LDX 
STX 
LDX 
STX 
BR 


CPA 
BRLT 
CPA 
BRGT 
LDX 
LDA 
ASLA 
BRV 
BR 
STX 
STA 
ASLA 
BRV 
BR 
STX 
ASLA 
BRV 
BR 
STX 
ADDA 


PRU AAZ (FAA) 


TRUE, i 
isNeg,s 
sign,i 
state,s 
do 


E A 
ifWhite 
ae 
ifWhite 
FALSE, i 
isNeg,s 


valAscii,s 


total,s 
digit,i 
state,s 
do 


ee 
do 
RE” gt 
deciErr 
do 


i 


deciErr 
"9" 4 
deciErr 


valAscii,s 


total,s 
digit,i 
state,s 
do 


me st 


deciNorm 


ee 


deciNorm 


TRUE,7 
total,s 


ovfll 

L1 
isOvfl,s 
temp,s 


ovfl2 
L2 
isOvfl,s 


ovf13 

L3 
isOvfl,s 
temp,s 


图 8-14 


;isNeg := TRUE 


;State := sign 


:else if (asciiCh is a digit) 


;isNeg := FALSE 


:total := Value(asciiCh) 


;State := digit 


;else if (asciiCh is not a Space 


:or line feed) 
:exit with DECI error 


:if asciiCh (is not a digit) 


exit with DECI error 
:else total := Value(asciiCh) 


;State := digit 


;if (asciiCh is not a digit) 


;exit normally 

;else X := TRUE for later assignments 
;Multiply total by 10 as follows: 
;First, times 2 

;If overflow then 


;isOvfl := TRUE 

;Save 2 * total in temp 
;Now, 4 * total 

;If overflow then 


;isOvfl := TRUE 
:Now, 8 * total 
:If overflow then 


;isOvfl := TRUE 
;Finally, 8 * total + 2 * total 


( 续 ) 
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12FEB2 ovfl4 ;If overflow then 

O4FEB5 L4 

EBO006 ovfl4: isOvfl,s ;isOvfl := TRUE 

730008 L4: valAscii,s ;A := 10 * total + valAscii 
12FEBE ovf15 ;If overflow then 

04FEC1 LS 

EB0006 ovf15: isOvfl,s sisOvfl := TRUE 

E3000A L5: total,s ;Update total 

O4FDE5 BR do 

C30004 deciNorm:LDA isNeg,s :If isNeg then 

OAFEE3 BREQ setNZ 

C3000A LDA total,s ;If total != 0x8000 then 
BO8000 CPA 0x8000, i 

OAFEDD BREQ L6 

lA . NEGA ;Negate total 

E3000A STA total,s 

O4FEE3 BR setNZ 

C00000 : LDA FALSE, i ;else -32768 is a special case 
E30006 STA isOvfl,s ;isOvfl := FALSE 

DBOOOE setNZ: LDBYTEX oldNZVC,s ;Set NZ according to total result: 
980001 ANDX 0x0001,i ;First initialize NZV to 000 
C3000A LDA total,s ;If total is negative then 
OEFEF2 BRGE checkZ 

A80008 ORX 0x0008, i ;Set N to 1 

B00000 checkZ: CPA 0,7 ;If total is not zero then 
OCFEFB BRNE sety 

A80004 ORX 0x0004,i ;Set Z to 1 

C30006 setV: LDA isOvfl,s ;If not isOvfl then 

OAFFO4 BREQ storeF] 

A80002 ORX 0x0002 , i ;Set V to 1 

FBOOOE storeFl: STBYTEX oldNZVC,s ;Store the NZVC flags 
C3000A exitDeci:LDA total,s ;Put total in memory 

E2FC55 STA opAddr,n 

60000C ADDSP 12,1 ;Deallocate locals 

58 RETO ;Return to trap handler 


50000A deciErr: CHARO "An yi 

COFF21 LDA deciMsg,i ;Push address of message onto stack 
E3FFFE STA “25 

680002 SUBSP 2,i 

16FFE2 CALL prntMsg ;and print 

00 STOP ;Fatal error: program terminates 


E 
全 


455252 deciMsg: .ASCII “ERROR: Invalid DECI input\x00" 





图 8-14 ( 续 ) 


DECI 中 断 处 理 程序 从 地 址 FDD3 的 LDA 语句 开始 ， 它 的 处 理 遵 循 图 8-13 的 逻辑 。 例 
程 检测 值 超出 范围 的 输入 字符 串 ， 如 果 检 测 到 了 ， 就 在 陷阱 期 间 把 PCB 中 的 V 位 设置 为 1。 
当 RETTR 将 控制 返回 给 应 用 程序 后 ，Asmb5 层 程序 员 将 能 够 检测 执行 DECcI 后 的 溢出 。 
isOvfl 是 一 个 布尔 标识 ， 指 示 是 否 发 生 了 溢出 。 


413 


414 
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地 址 FDES 是 FSM 循环 的 开始 ， 从 do 符号 可 以 看 出 来 。FDEB 的 ANDA Ekk T RA 4 
位 以 外 其 余 的 输入 字符 ， 留 下 的 是 十 进 制 ASCII 数字 对 应 的 二 进 制 值 。 例 如 ，ASCII 的 S, 
它 的 二 进 制 表示 是 0011 0101， 最 右 4 位 0101 是 十 进 制 数 相应 的 二 进 制 值 。 地 址 FDF1 处 ， 
RIM As ARG IZ ASCII 字符， 并 在 整个 循环 过 程 中 保持 它 。 地 址 FDFB 的 stateJT 是 FSM 
中 switch 语句 的 转移 表 。 

从 地 址 FE01 到 FE58 的 代码 是 state 为 值 sInit 的 情况 ， 即 FSM 的 起 始 状 态 。 因 为 
整个 循环 过 程 中 累加 器 要 保持 ASCII 字符 用 于 比较 ， 所 以 所 有 的 赋值 语 Fa RBS LE A 
存 器 而 不 是 累加 器 进行 。 例 如 ， 地 址 FE07 的 isNeg 赋值 为 FALSE 是 通过 LDX 后 面 跟 STX 
而 不 是 LDA 后 面 跟 STA 来 执行 的 。 

从 地 址 FE5B 到 FE73 的 代码 是 state 为 值 ssign 的 情况 ， 从 地 址 FE76 到 FEC4 是 
state 为 值 sDigit 的 情况 。Pep/8 没有 把 一 个 值 乘 以 10 (dec) 的 指令 ， 这 段 代 码 用 多 个 左 
移 运算 来 执行 这 个 乘法 。 每 个 ASLA 把 值 乘 以 2，3 个 ASLA 运算 将 值 乘 以 8， 把 这 个 值 加 
上 原始 值 乘 以 2 就 得 到 这 个 值 乘 以 10 的 值 。 在 ASLA 运算 和 加 法 运算 之 后 ， 该 例 程 会 检测 
溢出 并 相应 地 设置 i sOvF1. 

从 地 址 FEC7 到 FF20 的 代码 在 循环 之 外 。 在 两 种 情况 下 算法 会 退出 循环 : 正常 退出 或 
者 检测 到 输入 错误 。 如 果 正 常 退出 ， 它 会 检测 isNeg 看 数字 串 前 面 是 否 有 负 号 ， 如 果 有 ， 
地 址 FED6 的 指令 通过 取 补 码 将 这 个 数 取 负 。 

数字 32 768 (dec) 等 于 8000 (hex)， 必 须 当 作 一 种 特殊 情况 来 处 理 。 如 果 输 入 是 -32 768, 
当地 址 FEBS 的 32 760 加 8 时 ，FSM 将 把 isOvfl 设置 为 tue。 问 题 是 尽管 -32 768 在 范围 
内 ,但 32 768 超出 范围 。 该 例 程 在 地 址 FEE0 为 这 种 特殊 情况 调整 i sOvf1。 

从 地 址 FEE3 到 FF04 的 代码 调整 进入 陷阱 时 存储 的 N、Z 和 V 标识 位 的 副本 。 地 址 
FEE6 的 ANDX 把 NZV 设置 为 000。 注 意 掩 码 是 01 (hex), BP 0000 0001 (bin), AX C 是 最 
右 的 位 ， 所 以 AND 运算 后 它 保持 不 变 。 地 址 FEES 的 LDA 把 已 分 析 的 值 放 入 累加 器 ， 并 相 
应 地 设置 CPU P N, ZA V 位 的 当前 值 。 代 码 把 PCB AN 和 2Z 的 副本 设置 成 等 于 CPU 中 
N 和 Z 的 当前 值 ， 根 据 先 前 分 析 中 计算 的 isovf1 值 设 置 V 的 副本 。 

现在 已 经 输入 和 分 析 了 该 十 进 制 值 ， 陷 阱 处 理 程 序 必 须要 把 它 存储 在 内 存 中 ， 存 储 地 址 
是 由 引发 陷阱 的 DECI 的 操作 数 指 定 的 。FF07 处 的 指令 


LDA total,s 
STA opAddr,n 


执行 这 个 存储 。LDA 把 计算 出 的 值 装 载 到 累加 器 ，STA 用 间接 寻 址 把 它 存储 到 opAddr, X} 
于 间接 寻 址 方式 操作 数 指示 符 是 操作 数 的 地 址 的 地 址 。 回 想 先 前 在 FDCD 处 ,计算 了 操作 
数 的 地 址 ， 存 储 在 opAddr 中 ， 因 此 opAddr 就 是 操作 数 的 地 址 的 地 址 ， 它 正 是 我 们 所 需 
要 的 。 

当 输入 字符 串 不 能 正常 分 析 时 ， 执 行 从 FF11 到 FF20 的 代码 ， 它 会 通过 调用 prntMsg 输 
出 错 信 息 。 如 图 8-16 所 示 ，prntMsg 是 一 个 输出 以 空 结尾 字符 串 并 立即 终止 应 用 程序 的 程序 。 


8.2.8 DECO 陷阱 处 理 程序 


图 8-15 是 DECO 指令 的 陷阱 处 理 程序 。 这 个 程序 输出 DEco 的 操作 数 ， 输 出 格式 等 价 于 
C++ 的 对 整数 值 的 cout <<。 因 为 能 存储 的 最 大 值 是 32 767， 所 以 这 个 例 程 最 多 输出 $ 个 
字符 。 如 果 需 要 ， 会 在 数值 前 面 加 上 人 负 号 。 





gexekkkek Opcode 0x38 

;The DECO instruction. 

;Output format: If the operand is negative, the algorithm prints 
:a single '-' followed by the magnitude. Otherwise it prints the 
;magnitude without a leading '+'. It suppresses leading zeros. 


remain: .EQUATE 0 ;Remainder of value to output 
chOut: .EQUATE 2 ;Has a character been output yet? 
place: .EQUATE 4 :Place value for division 

FF3B COOOFF opcode38:LDA OxOOFF,7 cassert Ta Ga Tis So ST, Ks SX, SXF 

FFSE ELFGSS STA addrMask,d 

FF41 16FCCA CALL assertAd 

FF44 16FD19 CALL setAddr ;Set address of trap operand 

FF47 680006 SUBSP 6,1 ;Allocate storage for locals 

FF4A C2FC55 LDA opAddr,n ;A := oprnd 

FF4D B00000 CPA Bi ;If oprnd is negative then 

FF50 OEFFS7 BRGE printMag 

FF53 500020 CHARO ret :Print leading '-' and 

FF56 1A NEGA ;make magnitude positive 

FF57 £30000 printMag:STA remain,s :remain := abs(oprnd) 

FF5A C00000 LDA FALSE,i sInitialize chOut := FALSE 

FF5D £30002 STA chOut,s 

FF60 C02710 LDA 10000, i ;place := 10,000 

FF63 £30004 STA place,s 

FF66 16FF91 CALL divide ;Write 10,000's place 

FF69 C003E8 LDA 1000,7 ;place := 1,000 

FF6C £30004 STA place,s 

FF6F 16FF91 CALL divide ;Write 1000's place 

FF72 C00064 LDA 100,71 ;place := 100 

FF75 E30004 STA place,s 

FF78 16FF91 CALL divide ;Write 100's place 

FF7B C0O000A LDA 10,7 ;place := 10 

FF7E £30004 STA place,s 

FF81 16FF91 CALL divide ;Write 10's place 

FF84 C30000 LDA remain,s ;Always write l's place 

FF87 A00030 ORA 0x0030, i ;Convert decimal to ASCII 

FF8A F1FC50 STBYTEA byteBuff,d 

FF8D 51FC50 CHARO byteBuff,d 

FF90 5E RET6 


;Subroutine to print the most significant decimal digit of the 
sremainder. It assumes that place (placez here) contains the 
;decimal place value. It updates the remainder. 


remain2: .EQUATE 2 ;Stack addresses while executing a 
chOut2: .EQUATE 4 ;subroutine are greater by two because 
place2: „EQUATE 6 sthe retAddr is on the stack 

FF91 C30002 divide: LDA remain2,s ;A := remainder 

FF94 C80000 LDX 0,7 eX := 0 

FF97 830006 divLoop: SUBA place2,s ;Division by repeated subtraction 

FF9A O8FFA6 BRLT writeNum ;If remainder is negative then done 

FF9D 780001 ADDX Ly x re Xe 1 

FFAO £30002 STA remain2,s ;Store the new remainder 


图 8-15 DECO 陷阱 处 理 程 序 
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04FF97 BR divLoop 


B80000 writeNum:CPX 0,i :If X != 0 then 

OAFFB5 checkOut 

C00001 TRUE, i ;chOut := TRUE 

£30004 chOut2,s 

O4FFBC printDgt ;and branch to print this digit 
C30004 checkOut:LDA chOut2,s ;else if a previous char was output 
OCFFBC BRNE printDgt ;then branch to print this zero 

58 RETO ;else return to calling routine 


A80030 printDgt:ORX 0x0030, i ;Convert decimal to ASCII 
E9FC4F STX wordBuff,d ;for output 

51FC50 CHARO byteBuff,d 

58 RETO ;return to calling routine 





图 8-15 ( 续 ) 


通常 ， 陷 阱 处 理 程序 从 在 FF3B 开头 的 语句 判断 寻 址 方式 是 否 合法 ， 调 用 例 程 计算 操作 
数 的 地 址 ， 给 局 部 变量 分 配 存储 空间 。 和 DECI 陷阱 处 理 程序 相 比 ，FF4A 的 语句 


LDA opAddr,n 


用 装载 指令 而 不 是 存储 指令 来 访问 操作 数 ， 因 为 DEco 是 一 个 输出 语句 而 不 是 输入 语句 。 和 
DECI 处 理 程序 一 样 ， 采 用 间接 寻 址 方式 通过 opAddr 访问 操作 数 。 

从 FF4D 到 FF56 的 代码 检测 是 否 是 负 值 。 如 果 操 作 数 为 负 ，FF53 的 CHARO 输出 负 号 ， 
接着 后 面 的 代码 对 操作 数 取 人 负 。 在 FF57 累加 器 包含 操作 数 的 大 小 ， 它 存储 在 remain 中 ， 
代表 余数 。 

从 FF5A 到 FF81 的 代码 写 出 操作 数 大 小 的 万 位 、 千 位 、 百 位 和 十 位 。 为 了 防止 在 最 开 
LERO, 将 chout 初始 化 为 false， 表 示 还 没有 输出 任何 数字 字符 。 

子 程序 divide 输出 place 位置 值 上 的 数字 字符 ， 减 小 remain 用 于 下 次 调用 。 例 如 ， 
如 果 在 FF66 处 的 调用 divide 之 前 remain 的 值 是 24 873， 那 么 divide 将 输出 2， 并 将 
remain 变 为 4873， 也 把 chout 设置 为 true。 

在 输出 字符 0 之 前 ，divide 检测 chout 是 否 已 经 输出 了 数字 字符 。 如 果 chout 为 
false， 那 么 该 字符 是 前 导 0， 不 能 输出 ; 否则 是 中 间 的 0， 可 以 输出 。 例 如 ， 如 果 在 FF6F 处 
的 调用 之 前 remain 是 761, .那么 divide 什么 都 不 输出 ，remain 继续 保持 为 761，chout 
也 继续 保持 为 falses PE chout 的 值 是 什么 ， 从 FF84 开始 的 代码 都 写 个 位 ， 因 此 如 果 原 
始 操作 数 的 值 是 0， 就 输出 0。 

从 FF91 到 FFC5 的 代码 是 输出 remain 最 高 有 效 位 的 子 程序 。 它 通过 反复 从 remain 
减 去 place 来 确定 输出 值 ， 记 录 减 法 的 次 数 ， 直 到 remain 小 于 0。 它 的 作用 是 计算 
remain/place 输出 的 值 。 


8.2.9 STRO 陷阱 处 理 程序 和 OS 向 量 


图 8-16 是 STRO 指令 的 陷阱 处 理 程 序 ， 在 功能 上 类 似 于 DECO 陷阱 处 理 程序 。 因 为 它 是 
一 条 输出 指令 ， 所 以 首先 用 FFD2 的 指令 


LDA opAddr,d 
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大 大大 大 Opcode 0x40 
;The STRO instruction. 
;Outputs a null-terminated string from memory. 
C00016 opcode40:LDA 0x0016, i ;Assert d, n, sf 
ELFCS3 STA addrMask,d 
16FCCA CALL assertAd 
16FD19 CALL setAddr ;Set address of trap operand 
C1FC55 LDA opAddr,d ;Push address of string to print 
ESFFFE STA -2,8 
680002 SUBSP 2,1 
L6FFE2 CALL prntMsg ;and print 
600002 ADDSP 2,i 
58 RETO 
[Rees Print subroutine 
;Prints a string of ASCII bytes until it encounters a null 
;byte (eight zero bits). Assumes one parameter, which 
;contains the address of the message. 


msgAddr: .EQUATE 2 ;Address of message to print 


C80000 prntMsg: LDX 0,7 ;X := 0 

C00000 LDA 0,7 ;A := 0 

D70002 prntMore:LDBYTEA msgAddr,sxf;Test next char 

OAFFF7 BREQ exitPrnt :If null then exit 

570002 CHARO msgAddr,sxf;else print 

780001 ADDX Lo sX := X + 1 for next character 
O4FFE8 BR prntMore 


58 exitPrnt:RETO 
;* 太 大大 大 大 大 Vectors for System Memory Format 
.ADDRSS osRAM ;User stack pointer 
.ADDRSS wordBuff ;System stack pointer 
.ADDRSS loader ;Loader program counter 
.ADDRSS trap ;Trap program counter 





图 8-16 STRO 指令 的 陷阱 处 理 程序 


获取 操作 数 的 地 址 ， 然 后 把 要 输出 的 字符 串 的 地 址 压 入 运行 时 栈 ， 调 用 FFE2 的 prntMsg 
子 例 程 。 实 际 上 ， 字 符 串 就 是 一 个 字符 数组 ， 所 以 这 个 过 程 类 似 于 一 个 以 数组 作为 参数 传递 
的 C++ 程序 的 翻译 。 因 此 输出 子 例 程 在 语句 


LDBYTEA msgAddr,sxf 


中 使 用 栈 变 址 间接 寻 址 方式 ， 而 语句 


CHARO msgAddr,sxf 


访问 字符 数组 的 一 个 元 素 。 

HLAS tet Ft AY. ADDRSS 汇编 指令 建立 的 。 把 这 个 代码 与 图 8-1 和 图 8-2 进行 比较 ， 你 
会 看 到 FFF8 处 的 向 量 是 osRAM 的 地 址 ， 它 是 操作 系统 RAM 最 顶部 的 字 节 。 当 用 户 选择 模 
拟 亏 的 执行 选项 时 ， 硬 件 将 SP 初始 化 为 这 个 值 ， 它 是 用 户 堆栈 最 底部 的 字 节 。 

FFFA 的 回 量 是 wordBuff 的 地 址 。 图 8-2 显示 wordBuff 是 预 留 给 系统 栈 的 128 字 节 
存储 块 下 面 的 字 节 。 当 用 户 选 择 模拟 器 的 装载 选项 时 ， 硬 件 把 SP 初始 化 为 这 个 值 ， 当 执行 
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陷阱 指令 时 ， 从 这 个 点 开始 把 PCB EAR. 

FFFC 的 向 量 是 装载 器 的 地 址 ， 如 图 8-3 所 示 。 当 用 户 选 择 装 载 选项 时 人 硬件 将 PC 初始 
化 为 这 个 值 。FFFE 的 向 量 是 中 断 处 理 程序 进入 点 的 地 址 ， 如 图 8-6 所 示 。 当 执行 陷阱 指令 
时 ， 人 硬件 将 PC 初始 化 为 这 个 值 。 


8.3 ”并 发 进程 


记 住 进程 是 执行 时 的 程序 。8.2 节 展 示 了 操作 系统 在 进程 的 执行 过 程 中 如 何 暂 停 它 来 所 
供 服务 。 对 于 一 个 使 用 DECI 和 DECO 的 进程 ， 它 的 CPU 活动 时 间 线 如 图 8-17 所 示 。 阴 影 
部 分 代表 CPU 执行 陷阱 服务 例 程 的 时 间 。 除 了 这 个 图 展示 了 操作 系统 在 进程 结束 前 暂停 它 ， 
然后 在 这 个 服务 完成 后 继续 此 进程 外 ， 它 在 形式 上 类 似 于 图 8-4 的 时 间 线 。 


应 用 程序 DECI 应 用 程序 DECO 应 用 程序 
陷阱 陷阱 


图 8-17“” 当 操作 系统 执行 一 个 包含 DECI 和 DECO 指令 的 程序 时 ，CPU 使 用 的 时 间 线 


因为 正在 执行 的 进程 是 通过 操作 系统 代码 中 未 实现 的 操作 码 来 初始 化 这 些 陷阱 的 ， 所 
以 8.2 节 中 描述 的 陷阱 叫 作 软 中 断 〈software interrupt)。 它 们 也 称 为 同步 中 断 (synchronous 
interrupt)， 因 为 每 次 执行 进程 时 中 断 同 时 发 生 ， 中 断 和 代码 是 同步 的 ， 是 可 以 预知 的 。 
男 一 个 初始 化 同步 中 断 的 方法 是 执行 一 个 操作 系统 调用 。 操 作 系 统 调 用 通常 的 汇编 层 助 
记 符 是 SVC ， 它 代表 管理 程序 调用 ( supervisor call)。 操 作 数 指示 符 一 般 作 为 系统 调用 的 参 
， 告 诉 系 统 程序 想 请 求 哪个 服务 。 例 如 ， 如 果 你 想 用 与 C++ 中 的 cout .Flush() 对 等 的 
果 数 来 刷新 缓冲 区 中 流 的 内 容 ，flush() 的 代码 是 27， 因 此 你 可 以 执行 
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8.3.1 异步 中 断 


另 一 种 类 型 的 中 断 是 异步 中 断 (asynchronous interrupt)， 在 执行 期 间 ， 它 的 发 生 时 间 不 
可 预测 。 异 步 中 断 的 两 个 常见 原因 是 

e 超时 

e 1/0 完成 

为 了 了 解 超时 如 何 引 发 异步 中 断 ， 考 虑 一 个 多 用 户 系统 ， 它 允许 多 个 用 户 同 时 访问 计 
算 机 。 因 为 大 多 数 计 算 机 仅 有 一 个 CPU， 所 以 操作 系统 必须 轮流 把 CPU 分 配给 每 个 用 户 的 
作业 ， 使 用 一 种 称 为 分 时 (time sharing) 的 技术 。 操 作 系 统 给 用 户 作 业 分 配 称 为 时 间 片 (time 
slice) 的 时 间 量 ,通常 大 约 是 100ms (1/10 秒 )。 如 果 用 户 作 业 在 这 个 时 间 内 没有 完成 (这 种 
情况 称 为 超时 )， 那 么 操作 系统 暂时 停止 这 个 作业 ， 并 给 下 一 个 作业 分 配 另 一 个 CPU 时 间 量 。 

要 实现 分 时 ， 硬 件 必须 提供 一 个 闹钟 ， 这 样 操作 系统 可 以 设置 成 在 每 个 时 段 产 生 一 个 中 断 。 

这 样 的 中 断 是 不 可 预测 的 原因 是 它 取决 于 系统 服务 用 户 的 请 求 有 多 忙 。 如果 没有 其 他 
的 作业 等 待 使 用 CPU， 那 么 系统 可 以 让 你 的 作业 运行 得 比 标准 时 间 片 更 长 一 些 。 如 果 男 一 
个 用 户 突然 请 求 服务 ， 那 么 操作 系统 会 立刻 暂停 你 的 进程 ， 并 给 正在 请 求 的 作业 分 配 CPU. 
那么 此 时 该 进程 的 中 断 时 间 点 就 不 同 于 一 个 时 间 片 超时 时 的 时 间 点 。 

异步 中 断 第 二 个 常见 的 源 是 IO SER. W/O 设备 的 一 个 基本 属性 是 相 比 于 CPU 处 理 速度 
它们 的 速度 很 慢 。 如 果 一 个 正在 运行 的 进程 请 求 从 键盘 输入 ， 用 户 的 啊 应 以 秒 计 ， 而 此 期 间 
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CPU 可 以 执行 男 一 个 进程 的 几 十 万 条 指令 。 即 使 进程 从 磁盘 文件 请 求 输 入 ， 也 比 从 键盘 输 
入 快 得 多 ,但 是 在 等 待 来 自 磁盘 的 信息 时 CPU 仍然 可 以 执行 数 千 条 指令 。 

为 了 不 浪费 CPU 时 间 ， 如 果 看 上 去 进程 需要 等 待 IO 完成 ,那么 操作 系统 可 以 暂停 请 
求 IO 的 进程 。 操 作 系 统 可 以 暂时 把 CPU 分 配给 第 二 个 进程 ， 当 知道 当 IO 完成 时 ， 第 一 
个 进程 可 以 立即 重新 获得 CPU。 因 为 第 二 个 进程 不 可 能 预测 IO 设备 何 时 将 完成 第 一 个 进程 
的 IO 操作 ， 因 此 它 不 知道 操作 系统 何 时 会 中 断 它 并 把 CPU 交 回 给 第 一 个 进程 。 

可 以 在 进程 间 切 换 保 持 CPU 繁忙 的 操作 系统 叫 作 多 道 程序 设计 系统 (multiprogramming 
system)。 要 实现 多 道 程序 设计 ， 硬件 必 须 向 IO 设备 提供 连接 ， 当 它们 完成 输入 /输出 操作 
时 可 以 给 CPU 发 送 中 断 信和 号 


8.3.2 ”操作 系统 中 的 进程 


操作 系统 的 一 个 目的 是 高 效 分 配 系 统 资源 。 多 道 程序 分 时 系统 给 系统 中 的 作业 分 配 
CPU 时 间 ， 目 的 是 保持 CPU 尽 可 能 地 执行 用 户 的 作业 而 不 是 空 闪 等待 IO。 操 作 系 统 尽量 
公平 地 调度 CPU 时 间 ， 使 得 所 有 的 作业 都 可 以 在 合理 的 时 间 内 完成 。 

在 任何 给 定 的 时 刻 ， 操 作 系 统 都 必须 维护 许多 被 暂停 、 正 在 等 待 轮 到 它们 使 用 CPU 时 
间 的 进程 。 它 通过 给 每 个 进程 分 配 一 个 单独 的 PCB 来 维护 所 有 这 些 进程 ， 这 个 PCB 类 似 于 
Pep/8 系统 中 断 处 理 程序 维护 的 PCB。 和 常见 的 做 法 是 用 链接 表 中 的 指针 把 PCB 连接 在 一 起 ， 
称 为 队列 (queue)， 图 8-18 展示 的 就 是 一 个 PCB 队列。 










图 8-18 进程 控制 块 的 队列 


每 个 PCB 包含 进程 在 最 近 一 次 中 断 时 所 有 CPU 寄存 器 值 的 副本 。 寄 存 器 组 必须 包含 程 
序 计数 器 的 副本 ， 这 样 进 程 就 可 以 从 中 断 发 生 的 位 置 继续 执行 。 

PCB 包含 一 些 可 以 帮助 操作 系统 调度 CPU 的 信息 。 一 个 例子 是 系统 分 配 的 唯一 的 进程 
标识 号 ， 即 图 8-18 中 的 进程 ID ， 它 起 到 标识 进程 的 作用 。 假 设 一 个 用 户 想 在 一 个 进程 正常 
执行 完 之 前 终止 它 ， 他 知道 ID 号 是 782， 他 可 以 发 布 KILL(782) 命令 ， 让 操作 系统 搜索 
PCB 队列 ， 找 出 ID 是 782 AY PCB, 将 它 从 队列 中 删除 ， 并 释放 它 。 

另 一 个 存储 在 PCB 中 信息 的 例子 是 暂停 的 进程 截至 目前 使 用 的 CPU 时 间 总 量 。 如 果 
CPU 变 为 可 用 ， 操 作 系 统 必 须 决 定 暂 停 的 进程 中 哪 一 个 将 得 到 CPU， 它 能 用 记录 的 时 间 做 
出 一 个 公平 的 深 征 。 

作业 在 系统 中 执行 直至 完成 ， 经 过 多 个 状态 ， 如 图 8-19 所 示 。 这 个 图 是 以 状态 转移 图 
的 形式 呈现 的 ， 是 有 限 状 态 机 的 又 一 个 例子 。 每 个 转移 都 标明 了 导致 状态 改变 的 事件 。 

当 用 户 提 交 了 一 个 要 处 理 的 作业 时 ， 操 作 系 统 生 成 一 个 进程 ， 即 为 它 分 配 一 个 新 的 
PCB， 并 把 它 加 入 等 待 CPU 时 间 的 进程 队列 。 它 把 程序 装载 到 主 存 ， 并 把 PCB 中 PC 的 副 


288 FLEE RUERAZ(PF4IZ) 


本 设置 为 进程 的 第 一 条 指令 的 地 址 。 这 样 作 业 就 在 准备 好 (ready) 状态 中 了 。 





图 8-19 ”操作 系统 中 作业 的 状态 转换 图 


操作 系统 最 终 会 让 该 作业 得 到 一 些 处 理 时 间 。 在 时 间 片 之 后 设置 闹钟 来 产生 中 断 ， 把 寄 
存 器 副本 从 PCB 放 和 人 到 CPU。 这 样 作业 就 在 运行 状态 中 了 。 

在 运行 状态 中 时 ， 可 能 会 发 生 3 类 事件 : 1 ) 当 亲 钟 中 断 时 ， 如 果 运 行 的 进程 仍然 在 执 
行 ， 就 会 超时 。 如 果 这 样 ， 操 作 系 统 就 把 这 个 进程 的 PCB 放 入 准备 好 队列 中 ， 进 程 也 就 再 
次 进入 准备 好 状态 。2 ) 进程 可 能 正常 完成 它 的 执行 ， 这 种 情况 下 ， 它 执行 的 最 后 一 条 指令 
是 SVC， 请 求 操作 系统 终止 这 个 进程 。3 ) 进程 可 能 需要 某 种 输入 ， 这 种 情况 下 它 执行 SVC 进 
行 请 求 ， 操 作 系 统 会 把 这 个 请 求 转 给 适当 的 IO 设备 ， 并 把 PCB 放 人 另 一 个 进程 队列 中 ， 即 等 
ff VO 操作 完成 的 队列 。 这 样 进程 就 在 等 待 VO 状态 中 了 。 

进程 在 等 待 IO 状态 中 时 ，1/O 设备 最 终 会 用 所 请 求 的 输入 中 断 系 统 。 此 时 系统 把 输入 
放 在 内 存 的 缓存 中 ， 把 进程 的 PCB 从 等 待 VO 队列 删除 ， 并 放 和 准备 好 队列 。 这 样 进程 就 
在 准备 好 状态 中 了 ， 在 这 个 队列 中 进程 最 后 将 得 到 更 多 的 CPU 时 间 ， 那 时 进程 就 可 以 访问 
缓存 中 的 输入 了 。 


8.3.3 ”多 处 理 


对 用 户 而 言 ， 作 业 只 是 从 开始 执行 到 结束 。 中 断 对 用 户 而 言 是 不 可 见 的 ， 就 像 DECI 中 断 对 
Asmb5 层 的 汇编 语言 程序 员 不 可 见 一 样 。 操 作 系 统 层 的 细节 对 更 高 抽象 层 的 用 户 是 不 可 见 的 。 

用 户 唯 一 可 以 感受 到 的 不 同 是 ， 如 果 系 统 中 有 很 多 作业 ， 那 么 执行 该 程序 将 会 花 更 长 
的 时 间 。 提 高 速度 的 一 种 方法 是 给 系统 配备 不 止 一 个 的 CPU， 这 样 的 配置 叫 作 多 处 理 系 统 
(multiprocessing system), K| 8-20 展示 了 一 个 有 两 个 处 理 顺 的 多 处 理 系 统 。 


图 8-20 多 处 理 系统 框图 


在 多 处 理 中 ， 因 为 CPU 在 进程 间 的 切换 非常 迅速 ， 所 以 看 上 去 就 像 它 们 在 并 发 地 执行 
一 样 。 操 作 系统 在 多 处 理 中 可 以 调度 不 止 一 个 进程 来 执行 ， 因 为 有 多 个 处 理 需 。 

如 有 果 性 能 的 提高 能 够 正比 于 系统 中 处 理 需 数量 的 增加 ， 那 就 好 了 。 遗 憾 的 是 ， 通 篆 实 际 
情况 并 不 是 这 样 。 当 给 系统 增加 更 多 的 处 理 融 时 ， 也 对 系统 的 通信 链 路 增加 了 更 多 的 要 求 。 
PION, WARE HH as i Be BI Al 8-20 所 示 的 公共 总 线 上 ， 那 么 总 线 可 能 会 限制 系统 的 性 能 。 
如 果 两 个 CPU 同时 请 求 从 输入 设备 恋人， 那么 其 中 一 个 将 不 得 不 等 待 。 增 加 越 多 的 CPU, 
就 会 越 频繁 地 发 生 这 样 的 冲突 。 
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多 处 理 器 系统 中 加 有 的 通信 开销 通常 会 导致 图 8-21 所 示 的 性 能 曲线 。 虚 线 说 明理 论 上 
增加 处 理 器 能 产生 的 最 大 好 处 ， 即 性 能 翻 倍 ， 实 际 上 性 能 不 会 提 
升 那么 多 。 


8.3.4 并 发 处 理 程序 


到 目前 为 止 ， 我 们 考虑 的 所 有 进程 都 是 相互 独立 的 ， 每 个 进 
程 属于 不 同 的 用 户 ， 并 且 进 程 之 间 没 有 交互 。 在 这 种 情况 下 ， 计 
算 结 果 不 受 中 断 发 生 时 间 的 影响 ， 中 断 唯 一 的 影响 是 增加 进程 执 
行 的 总 时 间 。 





处 理 器 个 数 
实际 上 ， 操 作 系统 管理 的 进程 通常 需要 和 其 他 进程 合作 来 执 
8-21 DiE 
行 它们 的 任务 。 图 8-22 中 的 程序 描述 了 两 个 必须 合作 以 避免 产 “人 the 


生 错 误 结 果 的 进程 的 情况 。 

假设 操作 系统 要 管理 一 个 航空 线路 的 数据 库 ， 这 个 数据 库 的 记录 会 同时 被 多 个 用 户 访 
问 。 每 个 航班 在 数据 库 中 有 一 条 记录 ， 除 了 其 他 一 些 信 
息 之 外 ， 该 记录 还 包括 这 个 航班 已 经 被 预订 出 去 的 座位 
数量 。 分 布 在 城市 中 的 多 家 旅行 社 代 理 代 表 可 能 的 用 户 
访问 该 系统 。 因 为 不 可 能 预测 某 个 旅行 代理 何 时 需要 
访问 该 系统 ， 所 以 对 数据 库 信 息 的 请 求 从 某 种 程度 上 
说 是 随机 的 。 

某 天 ， 两 个 不 同 代 理 的 客户 正好 同时 想 预 订 相 同 
的 航班 。 操 作 系 统 给 每 个 作业 创建 一 个 进程 ， 叫 作 PI 
和 了 P2， 图 8-22 展示 了 每 个 进程 的 代码 段 。numRes 代 
表 预 定 出 去 的 数量 ， 当 P1 和 了 2 在 系统 里 执行 时 ， 它 
是 一 个 整 型 变量 ， 值 放 在 内 存 中 。 

假设 两 家 代理 在 给 他 们 的 客户 预订 之 前 numRes 
的 值 是 47， 交 易 完 成 后 ，numRes 应 该 是 49。 在 C++ 
层 ， 每 个 进程 想 用 赋值 语句 numRes++ 把 numRes 增 
加 1。 如 果 赋 值 语句 是 原子 的 (atomic)， 即 不 能 分 割 的 ， 那 么 不 管 哪个 进程 先 执行 赋值 语 
A, CH 层 的 代码 段 都 将 会 产生 正确 的 结果 。 如 果 Pl 先 执行 ， 它 将 使 numRes 变 为 48 P2 
将 使 numRes 变 为 49 ; 如 果 P2 先 执 行 ， 它 将 使 numRes 4A 48, P1 将 使 numRes 变 为 49。 
不 管 哪 种 情况 ， 都 会 得 到 正确 的 值 49。 

问题 是 ，C++ 层 的 赋值 语句 不 是 原子 的 ， 它 们 被 编译 成 LDA、ADDA 和 STA， 在 一 个 任 
何 汇编 语言 语句 之 间 都 有 可 能 发 生 中 断 的 系统 中 执行 。 图 8-23 展示 了 一 个 执行 序列 的 历史 
记录 ， 可 以 看 到 什么 会 出 错 。A (P1 ) 是 P1 累加 器 的 内 容 ， 当 P1 运行 时 它 在 CPU 中 ， 当 
Pl 暂停 时 在 PCB 中 。A (P2 ) 是 P2 的 累加 器 。 

在 这 个 序列 中 ，P1 执行 LDA， 将 47 放 和 人 累加 器 ， 接 着 是 ADDA， 将 累加 器 增加 到 48, 
然后 操作 系统 中 断 P1 将 处 理 器 时 间 给 P2。P2 执行 它 所 有 3 条 语句 ， 将 内 存 中 的 numRes H 
为 48。 当 P1 终于 又 继续 执行 时 ， 它 也 将 numRes 设 为 48。 尽 管 每 个 进程 都 执行 了 它 所 有 的 
语句 ， 但 最 终结 果 是 numRes 为 48 而 不 是 49。 








C++ 层 


进程 Pl 进程 P2 





numRes++ numRes++ 











汇编 层 
进程 Pl 






进程 P2 


LDA numRes,d LDA numRes,d 
ADDA 1,i ADDA 1,7 
STA numRes,d STA numRes,d 





图 8-22 ”两 个 抽象 屋 上 的 并 发 进程 
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执行 的 语句 


(P1) LDA numRes,d 
(P1) ADDA 1,7 





图 8-23 图 8-22 序列 的 一 种 可 能 的 执行 历史 记录 


不 管 进程 是 在 真正 的 并 发 多 处 理 系统 中 ， 还 是 在 貌似 并 发 的 多 道 程序 系统 中 执行 ， 都 会 
发 生 这 种 问题 。 在 多 处 理 系 统 中 ，P1 和 P2 有 可 能 正好 同时 执行 ADDA 语句 ， 但 是 如 果 它 们 
想 同时 执行 STA 语句 ， 当 一 个 进程 在 往 内 存 写 人 值 时 ， 硬 件 会 强制 另 一 个 进程 等 待 。 从 尿 
辑 的 角度 来 看 ， 不 管 并 发 是 真 的 还 是 假 的 ， 这 种 问题 都 会 发 生 。 


8.3.5 ”临界 区 


问题 的 根本 原因 是 P1 和 P2 共享 部 分 主 存 ， 这 部 分 包含 numRes 的 值 。 无 论 何 时 并 发 进 
程 共享 一 个 变量 ， 总 是 有 可 能 的 结果 取决 于 中 断 发 生 的 时 间 。 要 解决 这 个 问题 ， 我 们 就 需要 
有 一 种 方法 能 确保 当 一 个 进程 访问 共享 变量 时 ， 另 一 个 进程 不 能 进行 访问 ， 要 一 直 等 到 第 一 
个 进程 结束 访问 后 才 可 以 。 

两 个 进程 中 互 斥 的 代码 叫 作 临界 区 (critical section)。 为 了 并 发 程序 能 够 正确 执行 ， 软 
件 必须 保证 如 果 一 个 进程 正在 执行 它 临界 区 中 的 语句 ， 那 么 另 一 个 进程 不 能 执行 它 临 界 区 
中 的 语句 。 为 了 解决 图 8-22 中 的 问题 ， 我 们 需要 找到 一 种 方法 ， 把 赋值 语句 放 到 临界 区 中 ， 
这 样 在 汇编 层 就 不 会 发 生 交 错 执行 了 。 

临界 区 需要 两 段 额外 的 代码 ， 叫 作 入 口 段 (entry section) 和 出 口 段 (exit section). P1 
的 入 口 段 正好 在 它 的 临界 区 前 面 ， 它 的 功能 是 测试 P2 是 否 正 在 执行 它 的 临界 区 ， 如 果 是 ， 
就 推迟 P1 临界 区 的 执行 直到 P2 完成 执行 它 的 临界 区 。P1 的 出 口 段 正 好 在 它 的 临界 区 后 面 ， 
它 的 功能 是 告知 P2，P1 已 经 不 在 临界 区 ， 这 样 P2 就 可 以 进入 它 的 临界 区 了 。 

图 8-22 中 每 个 进程 的 C++ 层 代 码 都 必须 按照 如 下 进行 修改 : 

其 余部 分 (remainder section) 

入 口 段 (entry section) 

numRes++ // 临界 区 (critical section) 


出 口 段 (exit section) 
其 余部 分 (remainder section) 





HEPI EAA 
其 余部 分 是 代码 中 可 以 和 其 他 进程 一 起 并 |， 
发 执行 且 不 会 有 错误 影响 的 部 分 ， 而 临界 entry section ” entry section 
区 是 代码 中 必须 互 斥 的 部 分 。 critical section critical section 
下 面 的 一 些 程序 展示 了 我 们 尝试 实现 een | aan i 
入 口 段 和 出 口 段 ， 它 们 保护 进程 对 临界 区 [while (! donel); while (! done2); 


的 访问 。 每 个 程序 假设 Pl 和 了 P2 是 图 8-24 图 8-24 ”临界 区 程序 的 通用 格式 
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那样 的 通用 格式 。donel 和 done2 是 在 其 余部 分 某 处 被 修改 的 〈 非 共享 的 ) 局 部 布尔 变量 。 
8.3.6 ”第 一 次 尝试 实现 互 斥 
图 8-25 的 程序 是 我 们 第 一 次 尝试 设 


计 入 口 段 和 出 口 段 ， 它 使 用 turn 这 个 共 [EEP 进程 P2 
享 整 型 变量 。 入 口 段 由 do 循环 组 成 ,， 它 |do do 

检测 turn 的 值 ; 出 口 段 由 赋值 语句 组 成 ， while (turn != 1) while (turn != 2) 
on ‘ 3 3 ; //nothing ; //nothing 
已 修改 turn 的 值 。 尽 管 这 里 的 代码 没有 critical section critical section 

给 出 来 ， 但 是 假设 在 进程 进入 do 循环 前 turn = 2; turn = 1; 


remainder section remainder section 
turn 被 初始 化 为 1 或 2。 while (! donel); while (! done2); 
入 口 段 中 的 do 循环 体 是 一 个 空 C++ 
语句 ， 它 在 汇编 层 不 会 生成 代码 。P1 的 人 eee tear 
口 段 代 码 被 翻译 成 


Loop: LDA turn,d 
COMPA 1,i 
BRNE Loop 
假定 turn 被 初始 化 为 1， 两 个 进程 同时 尝试 进入 它们 的 临界 区 。 不 管 怎样 交错 执行 人 
口 段 中 的 汇编 语句 ，P2 会 持续 循环 ， 直 到 P1 进入 它 的 临界 区 。 当 P1 完成 它 的 临界 区 ， 它 
的 出 口 段 将 把 turn 设置 为 2， 这 之 后 P2 就 能 够 进入 它 的 临界 区 了 。 


这 个 算法 保证 临界 区 是 互 斥 的 。 只 有 当 turn 是 2 时 ，P2 才能 在 它 的 临界 区 中 ， 在 此 期 


间 P1 不 能 在 它 的 临界 区 中 ， 反 之 亦 然 。 当 P2 离开 它 的 临界 区 后 ,将 turn 置 为 1， 这 是 P1 
可 以 进入 临界 区 的 信号 。 

尽管 这 个 算法 保证 了 互 斥 ， 但 是 它 也 要 求 进 程 严格 交替 执行 它们 的 do 循环 ， 这 可 不 太 
好 。 进 程 通过 共享 变量 turn 进行 通信 ， 它 一 直 记 录 着 谁 该 执行 它 的 临界 区 。 如 果 用 户 想 让 
P1 执行 数 次 do 循环 而 P2 根本 不 执行 ， 而 使 用 这 样 的 和 人口 段 和 出 口 段 ， 这 样 的 情况 是 绝对 
不 会 发 生 的 。 


8.3.7 第 二 次 尝试 实现 互 斥 


为 了 使 一 个 进程 能 够 执行 它 的 do 循环 而 不 受 另 一 个 进程 执行 的 限制 (除去 为 了 满足 互 
FRK), E 8-26 的 程序 使 用 了 两 个 共享 布尔 变量 enterl 和 enter2， 假 设 enterl 和 
enter2 都 初始 化 为 false。 

如 果 P2 在 它 的 其 余部 分 ，enter2 一 定 为 假 ， 那 么 P1 就 可 以 想 执行 它 的 do 循环 多 少 
次 就 执行 多 少 次 。 它 只 用 将 enter1 设置 为 


5 ee 进程 P1 进程 P2 
true， 在 while 循环 中 测试 enter2 一 次 ，| 一 一 Sees 
= f d 

执行 它 的 临界 区 ， 将 enteri 设置 为 false，| snterl - TRUE; enter2 = TRUE; 
执行 它 的 其 余部 分 。 它 可 以 想 怎 么 重复 这 个 while (enter2) while (enterl) 
4 ak AZ y 27 p ; //nothing ; //nothing 
循环 就 起 么 重复 。 类 似 地 ， 如 sal 在 6 的 critical section critical section 
其 余部 分 ，P2 可 以 重复 它 的 这 个 循环 。 enterl = FALSE: enter2 = FALSE; 


x REY 保 证 了 互 斥 。 当 P1 把 remainder section remainder section 
i 1 ! d ; hil ! rae 

enter1 设置 为 true 时 ， 就 是 给 p2 发 信号 while ( onel) while (! done2) 

告诉 它 正 在 尝试 进入 临界 区 。 如 果 P2 正好 图 8-26 ”编程 实现 互 斥 的 另 一 次 尝试 








427 


292 BRED RHEAKZ (FIZ) 


在 稍 早 一 点 的 时 候 在 它 的 while 测试 中 用 


LDA enterl,d 


获取 了 enterl, AA P2 不 会 立即 知道 P1 的 目的 ，P2 可 能 已 经 在 执行 它 的 临界 区 了 。 不 管 怎 
样 ， 如 果 P2 在 它 的 临界 区 中 ， 那 么 enter2 必定 为 tue，P1 的 while 循环 将 阻止 Pl 同时 也 进 
人 它 的 临界 区 。 当 P2 RABH, CHE enter2 设置 为 假 ， 这 样 就 允许 P1 进入 它 的 临界 区 。 

协同 执行 进程 的 设计 者 面临 的 问题 可 能 是 非常 微妙 和 意 想 不 到 的 ， 这 个 算法 就 是 一 个 这 
样 的 例子 。 尽 管 它 像 前 面 的 程序 一 样 ， 保 证 互 斥 而 且 不 限制 do 循环 的 执行 ， 但 是 它 仍然 有 
一 个 严重 的 漏洞 。 

图 8-27 展示 了 一 个 执行 序列 ，P1 设置 enterl 为 true， 然 后 遇 到 中 断 。P2 设置 enter2 
为 ture， 然 后 开始 执行 它 的 while 循环。 因为 enterl 为 true， 因 此 while 循环 将 继续 执行 
一 直到 P2 超时 ，P1 恢复 。 因 为 enter2 为 true， 所 以 P1 也 将 会 无 限 地 循环 。 


(P1) enter1=TRUE; 
(P2) enter2=TRUE ; 


图 8-27 图 8-26 所 示 程 序 的 一 个 会 产生 死 锁 的 执行 序列 


Pl 和 了 2 两 个 进程 都 处 于 想 进入 临界 区 的 状态 。P1 要 等 到 了 P2 进入 执行 它 的 临界 区 将 
enter2 设置 为 false 才能 进入 ,但 是 P2 要 等 到 了 P1 进入 执行 它 的 临界 区 将 enteri 设置 为 
false 才能 进入 。 两 个 进程 都 在 等 待 永远 不 会 出 现 的 情况 ， 这 种 局 面 叫 作 死 锁 (deadlock ) 。 
死 锁 就 像 死 循环 ， 要 避免 出 现 这 种 情况 。 


8.3.8 Peterson 互 斥 算法 


我 们 需要 一 种 解决 方法 ， 它 保证 互 斥 ， 人 允许 每 个 进程 外 面 的 do 循环 无 限制 地 执行 ， 并 
且 避 免 死 锁 的 出 现 。 图 8-28 是 Peterson 算法 的 实现 ， 它 结合 图 8-25 和 图 8-26 的 特性 来 实 
现 所 有 的 目标 ， 其 基本 思路 是 enterl fil enter2 提供 如 图 8-26 那样 的 互 斥 ， 即 使 在 同一 
时 间 两 个 进程 都 想 进 入 临界 区 ， 但 是 turn 只 人 允许 一 个 进入 。enterl 和 enter2 初始 为 
false, turn 初始 为 1 或 者 2。 


进程 Pl 进程 P2 
do 
enterl = TRUE; enter2 = TRUE; 
turn = 2; turn = 1; 
while (enter2 && (turn == 2)) while (enterl && (turn == 1)) 






; //nothing ; //nothing 
critical section critical section 
enterl = FALSE; enter2 = FALSE; 
remainder section remainder section 

while (! donel); while (! done2); 





图 8-28 Peterson 互 斥 算法 
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来 看 一 看 互 斥 是 如 何 保证 的 。 考 虑 如 果 Pl 和 了 2 同时 执行 它们 的 临界 区 的 情况 ，enter1 
和 enter2 都 将 为 ture。 在 P1 中 ,while 测试 意味 着 turn 的 值 为 1， 因 为 enter2 为 
true。 但 在 P2 中 ，while 测试 意味 着 turn 的 值 为 2， 因 为 enterl 为 true。 这 个 矛盾 表明 
Pl 和 了 2 不 可 能 同时 执行 它们 的 临界 区 。 

但 如 果 P1 和 了 2 同时 想 进 入 它们 的 临界 区 会 怎样 呢 ? 在 人 口 段 有 一 些 交 错 执行 会 导致 
它们 同时 执行 临界 区 吗 ? 答案 是 不 会 ， 即 使 有 AND 运算 的 while 测试 在 汇编 层 不 是 原子 
的 。 有 两 个 条 件 可 以 使 P1 通过 while 测试 进入 它 的 临界 区 : enter2 为 false 或 者 turn 为 
1。 如 果 任 一 条 件 满足 ,不管 男 一 个 条 件 如 何 ，P1 都 可 以 进入 临界 区 。 

假设 Pl 通过 while 测试 ， 因 为 它 用 

LDA enter2 ,d 
获得 enter2 的 值 ，enter2 HAA false. RA P2 在 它 的 其 余部 分 中 时 ， 这 才 会 发 生 。 即 
使 Pl 在 装载 enter2 的 值 后 被 中 断 ， 然 后 P2 设置 enter2 X true, turn 为 1，P2 也 不 能 进 
入 它 的 临界 区 ， 因 为 P1 CARE enterl X true H turn 现在 为 1。 

假设 Pl 通过 while 测试 ， 因 为 它 用 

LDA turn,d 
获得 turn WA, turn 的 值 为 1。 因为 P1 前 面 的 指令 把 turn 设置 为 2， 只 有 了 P1 在 它 的 前 
一 条 指令 和 while 测试 之 间 被 中 断 ， 且 P2 将 turn 设 为 1 时， 才 可 能 出 现 这 种 情况 。 但 是 
接着 ，P2 又 将 被 阻止 通过 它 的 while 循环 进入 临界 区 ， 因 为 P1 已 经 设置 enter1 为 真 且 
turn 现在 的 值 为 1。 

来 看 一 看 为 什么 不 会 发 生死 锁 。 假 设 两 个 进程 都 陷入 死 锁 ，( 在 多 处 理 系统 中 ) 并 行 或 
(在 多 道 程序 系统 中 ) 在 不 同 的 时 间 片 中 执行 它们 的 while 循环 。P1 中 的 while 测试 意味 
4 turn 的 值 必须 为 2， 但 是 P2 中 while 测试 意味 着 turn 的 值 必须 为 1。 这 个 矛盾 的 情况 
表明 两 个 进程 不 可 能 同时 都 在 循环 。 

假设 两 个 进程 同时 都 想 用 

STA turn,d 
设置 turn。 在 多 道 程 序 设计 系统 中 ， 因 为 必须 在 不 同 的 时 间 片 中 执行 ， 所 以 P1 给 turn 的 
赋值 一 定 会 发 生 在 P2 的 赋值 之 前 或 者 之 后 。 在 多 处 理 系 统 中 ， 如 果 两 个 进程 正好 同时 都 想 
在 主 存 中 给 turn 赋值 ， 那 么 当 其 中 一 个 进程 执行 STA 时 人 硬件 会 强制 另 一 个 进程 等 待 。 在 两 
种 系统 中 ， 先 给 turn 赋值 的 进程 将 进入 它 的 临界 区 ， 这 样 就 不 会 发 生死 锁 。 


8.3.9 信号 量 


尽管 图 8-28 中 的 程序 解决 了 临界 区 问题 并 避免 出 现 死 锁 ， 但 是 它 的 缺点 是 效率 低 。 阻 
止 进程 进入 临界 区 的 是 while 循环 ， 循 环 的 唯一 目的 是 拖延 进程 直到 它 被 中 断 ， 给 另 一 个 
进程 时 间 去 完成 执行 它 的 临界 区 。 因 为 进程 以 循环 的 方式 被 锁 在 自己 的 临界 区 之 外 ， 所 以 这 
样 的 循环 叫 作 旋 转 锁 (spin lock). 

旋转 锁 是 对 CPU 时 间 的 浪费 ， 尤 其 是 如 果 进 程 在 多 道 程序 设计 系统 中 执行 ， 并 被 分 配 
一 个 新 的 时 间 片 。 如 果 把 这 个 CPU 时 间 分 配给 男 一 个 进程 执行 一 些 有 用 的 工作 ， 那 就 会 更 
有 效率 。 信 号 量 (semaphore) 是 大 多 数 操作 系统 都 提供 的 用 以 并 发 编程 的 共享 变量 ,它们 可 
以 让 程序 员 不 用 旋转 锁 来 实施 临界 区 。 

信号 量 是 一 个 整数 型 变量 ， 它 的 值 只 能 由 操作 系统 调用 来 修改 。 对 信和 号 量 s 的 3 个 操作 是 
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© init (s) 

e wait (s) 

è signal (s) 
这 里 init, wait 和 signal 是 操作 系统 提供 的 过 程 。 在 汇编 层 ， 用 带 有 适当 操作 数 指示 符 
的 SVC 来 调用 这 些 过 程 。 信 号 量 是 带 操作 的 抽象 数据 类 型 (ADT) 的 又 一 个 例子 ， 它 的 含义 
程序 员 是 知道 的 ,但 它 的 实现 隐 尖 在 更 低 的 抽象 层 中 。(wait(s) 和 signal(s) 通常 又 分 
别 写 作 p(s) 和 v(s)。) 

RMA SH s 有 一 个 关联 的 进程 控制 块 队列 ， 叫 作 sQueue， 它 代表 被 挂 起 的 进程 。 这 
几 个 操作 的 含义 是 

init(s) 


s=1; 


SQueue = 一 个 进程 控制 块 的 空 列表 





wait(s) 
Ba 
if (s < 0) 

挂 起 该 进程 ， 把 它 添加 到 sQueue 中 


signal(s) 
ask 
if (s <= 0) 
从 sQueue 取出 一 个 进程 加 入 准备 好 队列 中 


每 个 操作 都 有 一 个 重要 的 特性 ， 那 就 是 操作 系统 保证 它们 是 原子 的 。 例 如 ， 不 可 能 两 个 进程 
同时 执行 signa1(s)， 而 s 只 增加 了 1， 像 图 8-22 中 的 numRes 那样 。 汇 编 层 的 赋值 语句 
绝 不 会 交叉 执行 。 

图 8-29 是 操作 系统 中 提供 信号 量 的 作业 的 状态 转移 图 。 与 在 准备 好 状态 的 进程 是 暂 
停 的 ， 它 的 PCB 是 在 准备 好 队列 中 一 样 ， 在 waiting-for-s 状态 的 进程 是 暂停 的 ， 它 的 
PCB 在 sQueue 中 。 这 样 的 进程 被 阻止 运行 ， 因 为 它 必须 转移 到 准备 好 状态 才能 执行 。 
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图 8-29 操作 系统 中 提供 信号 量 的 作业 的 状态 转换 图 


如 果 一 个 正在 运行 的 进程 执行 wait(s)， 当 s 大 于 0 时 ，wait(s) 只 是 将 s 减 1， 进 
程 继 续 执行 ; 当 s 小 于 或 等 于 0 时， 正在 运行 的 进程 执行 wait(s ) 会 转移 到 等 待 s 状态 。 
如 果 当 s 大 于 或 等 于 0 时 ， 一 个 正在 运行 的 进程 执行 signal1(s)， 它 只 是 将 s 加 1， 进 程 
继续 执行 ; 当 s 小 于 0 时 ,正在 执行 signal1(s ) 的 进程 会 引发 某 个 正在 等 待 s 的 进程 被 操 
作 系 统 挑选 出 来 放 到 准备 好 状态 中 。 执 行 signa1(s ) 的 进程 继续 运行 。 


wait(s) 
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J wait Al signal 的 定义 来 说 ，s 为 负 值 表示 一 个 或 多 个 进程 被 阻塞 在 sQueue F, Mi s 
的 大 小 就 是 被 阻塞 进程 的 数量 。 例 如 ， 如 果 s 值 为 -3， 那 么 就 有 3 个 进程 阻塞 在 sQueue 中 。 

signal(s) 执行 时 如 果 有 多 于 一 个 进程 被 阻塞 ， 那 么 操作 系统 尽力 在 选择 进程 转移 到 
准备 好 状态 这 件 事情 上 保持 公平 。 通 用 的 策略 是 使 用 先进 先 出 〈First In, First Out, FIFO) 
的 调度 策略 ， 这 样 阻 塞 时 间 最 长 的 进程 会 被 送 到 准备 好 状态 。FIFO 是 队列 区 别 于 栈 的 特性 ， 
栈 是 后 进 先 出 (Last In，First Out, LIFO), 

图 8-29 仅 展 示 了 一 个 信号 量 等 竺 状态。 在 提供 信号 量 的 系统 中 ， 程 序 员 可 以 想 声 明 多 
少 个 就 声明 多 少 个 不 同 的 信号 量 ， 操 作 系 统 会 为 每 个 信号 量 维护 一 个 阻塞 进程 队列 。 


8.3.10 ”市 信号 量 的 临界 区 
如 果 操 作 系 统 提供 信号 量 ， 那 对 程序 来 说 临界 区 就 很 容易 了。 图 8-30 的 程序 假设 mutEx 


是 一 个 用 init(mutEx) 初始 化 为 1 的 信号 量 。 FE pi HE P 

第 一 个 执行 wait(CmutEx) 的 进程 将 把 |G, 
mutEx 从 1 变 为 0， 并 进入 它 的 临界 区 。 如 果 wait(mutEx); wait(mutEx); 

Š . 4— i J critical section critical section 
其 他 进程 在 此 期 间 执行 We Ds SA Signal (mutEx) ; signal (mutEx); 
将 把 mutEx 由 0 变 为 -1， 操 作 系 统 将 立即 阻 remainder section remainder section 
ET 当 第 一 个 进程 最 终 离开 它 的 临界 区 时 ， while (! donel); while (! done2); 
将 执行 signal(mutEx)， 这 将 把 另 一 个 进程 图 8-30 ”使 用 信号 量 的 临界 区 


放 入 准备 好 状态 中 。 

由 于 操作 系统 保证 wait 和 signal 是 原子 的 ， 所 以 程序 员 不 需 担 心 在 入 口 段 和 出 口 段 
中 的 操作 交错 执行 。 因 为 系统 会 立即 把 第 二 个 进程 放 在 mutEx 的 等 待 队 列 中 ， 因 此 也 不 会 
在 旋转 锁 上 浪费 时 间 。 当 然 ， 隐 藏 细节 并 不 是 消除 细节 。 要 提供 信号 量 ， 操 作 系 统 设计 者 必 
须 利 用 硬件 的 特性 ， 还 要 使 用 和 前 面 程序 中 一 样 的 算法 推理 思路 。 信 号 量 可 以 满足 操作 系统 
的 两 个 目标 器 高 级 编程 提供 方便 的 环境 ; 高 效 地 分 配 系统 资源 。 


Fernando J. Corbato 

1926 4 7 A 1 S Fernando J. Corbat6 生 于 加 利 福 尼 亚 州 奥克兰 。1950 年 ， 他 从 MIT 
获得 硕士 学 位 ，1956 年 他 从 MIT 获得 物理 学 博士 学 位 。 他 最 著名 的 工作 是 两 个 开创 性 的 
操作 系统 一 一 兼容 分 时 系统 ( Compatible Time-Sharing System, CTSS) 和 多 工 信 息 和 计 
算 服 务 (Multiplexed Information and Computing Service, Multics), 

在 操作 系统 出 现 以 前 ， 一 个 机 构 中 的 计算 机 用 户 会 请 求 分 配 一 天 中 的 某 段 时 间 ， 物 理 
上 的 去 操作 这 个 计算 机 ， 在 这 期 间 ， 其 他 的 用 户 不 能 访问 这 台 计 算 机 。 最 早 最 基础 的 操作 
系统 使 用 批 处 理 ， 有 一 个 人 接收 各 个 用 户 的 作业 ， 也 就 是 一 堆 打 孔 的 卡 ， 然 后 代替 这 些 用 





户 去 操作 计算 机 。 调 试 程序 是 很 费时 的 ， 程 序 员 在 每 次 编译 完成 到 获得 程序 报 出 的 错误 之 
间 ， 有 时 需要 等 待 几 个 小 时 。 

在 20 世纪 50 年 代 末 ， 许 多 科学 家 ， 包 括 MIT 的 John McCarthy 和 牛津 大 学 的 Christopher 
Strachey， 开 始 提 出 分 时 的 概念 ， 允 许多 个 用 户 同时 通过 拨号 调制 路 由 器 和 打字 控制 台 远 
程 登录 到 计算 机 上 。 看 上 去 好 像 每 个 用 户 都 拥有 对 计算 机 的 完整 访问 ， 这 样 在 线 调试 极 大 
地 降低 了 软件 开发 的 时 间 。 

Corbat6 在 MIT 领导 小 组 ， 研 制 出 了 CTSS， 最 早 的 分 时 系统 之 一 。 它 是 为 IJBM 709 
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和 7090 设计 的 ， 能 够 同时 支持 4 个 用 户 一 一 3 个 使 用 打字 控制 台 ， 一 个 被 动用 户 。 内 存 
Æ 32K 个 36 位 的 字 ， 用 户 作 业 占 用 高 地 址 的 27K， 分 时 管理 程序 占用 低地 址 的 5K。 这 
个 小 组 修改 硬件 ， 使 之 能 够 提供 用 户 作 业 之 间 的 内 存 保护 。 

Multics 系统 是 一 个 更 有 雄心 的 项 目 ， 吸 取 了 CTSS 项 目的 经 验 教训 。 它 的 两 个 突出 特 
点 就 是 使 用 了 PLI 来 作为 实现 语言 和 内 存 保 护 的 环 机 制 。 在 Multics 
之 前 ， 大 多 数 的 操作 系统 是 用 汇编 语言 来 编写 的 。 就 在 Multics MA 
开始 的 时 候 ，IBM 刚刚 提出 了 Program-ming Language One ( PL/I) 
的 规范 。Corbat6 的 小 组 为 该 语言 开发 出 了 自己 的 编译 器 ， 因 为 当 
时 IBM 还 没 能 提供 一 个 商用 的 编译 器 。 

有 些 讽刺 的 是 ， 现 在 的 许多 个 人 计算 机 操作 系统 很 容易 受到 病 
毒 的 侵袭 ， 而 Multics 是 完全 免疫 的 。 目 前 为 止 最 常见 的 病毒 机 制 
就 是 缓冲 区 溢出 ， 也 就 是 程序 试图 访问 数组 超出 界限 的 地 方 。 今 天 
的 大 多 数 操 作 系 统 是 用 C 语言 编写 的 ， 它 会 允许 这 样 的 访问 ， 而 
PLI 不 允许 ， 这 也 是 为 什么 Multics 的 安全 性 这 么 高 的 原因 。 

因为 其 在 CTSS 和 Multics 项 目 上 的 开创 性 的 领导 工作 ，Fernando Corbat6 在 1990 年 
获得 图 灵 奖 。 他 现在 是 MIT 电子 工程 与 计算 机 科学 系 的 名 誉 退休 教授 。 





8.4 死 锁 


图 8-26 中 的 程序 展示 了 并 发 处 理 如 何在 共享 主 存 变 量 的 两 个 进程 之 间 产 生死 锁 。 当 进 
程 共享 其 他 资源 时 也 可 能 会 发 生死 锁 。 操 作 系 统管 理 的 资源 包括 打印 机 、 光 盘 (CD) 驱动 如 
和 磁盘 文件 。 并 发 进程 共享 这 些 资源 中 的 任意 之 一 都 有 可 能 导致 死 锁 。 

举 一 个 共享 这 些 资源 导致 死 锁 的 例子 。 假 设 进程 P1 请 求 计 算 机 唯一 的 一 个 CD Skah at 
进行 数据 输入 ， 操作 系 统 把 CD 驱动 器 分 配给 P1，P1 会 一 直 占 用 它 ， 直 到 不 再 需要 它 。P2 
可 能 要 从 磁盘 文件 请 求 输入 ， 操 作 系 统 打 开 这 个 文件 并 分 配给 这 个 进程 。 

现在 假设 Pl 需要 从 P2 正在 访问 的 磁盘 文件 读 入 ,但 因为 P2 已 经 打开 了 这 个 文件 ， 所 
以 操作 系统 不 会 同意 这 个 请 求 ， 要 一 直 等 到 此 文件 可 用 才 可 以 。 如 果 P2 请 求 CD Skah ait, 
操作 系统 也 会 阻止 它 直到 Pl 释放 该 驱动 句 。 

在 这 种 情况 下 ， 进 程 就 处 于 死 锁 的 状态 。P1 不 能 前 进 直到 P2 释放 磁盘 文件 为 止 ，P2 
不 能 前 进 直到 P1 释放 CD 驱动 器 为 止 。 两 个 进程 都 在 等 待 一 个 不 可 能 发 生 的 事件 ， 将 被 操 


8.4.1 资源 分 配 图 


为 了 有 效 地 管理 资源 ， 操 作 系统 需要 一 种 方式 能 够 发 现 可 能 As 

的 死 锁 。 它 采用 了 一 种 称 为 资源 分 配 图 (resource allocation graph) 

的 结构 。 资 源 分 配 图 是 系统 中 进程 和 资源 的 图 形 化 描述 ， 展 示 了 哪 “IN 

个 资源 分 配给 了 哪个 进程 ， 哪 个 进程 阻塞 在 了 对 哪个 资源 的 请 求 上 。 a 
图 8-31 中 的 资源 分 配 图 就 是 P1 Al P2 因为 对 CD 驱动 器 和 磁 

盘 文件 的 请 求 形成 了 死 锁 。 进 程 和 资源 是 图 中 的 结 点 ， 进 程 用 圆 wea 


圈 表 示 ， 资 源 是 方 框 里 的 实心 圆 点 。 有 两 种 类 型 的 边 : 分 配 边 和 图 8-31 一 个 具有 死 锁 循 
请 求 边 。 环 的 资源 分 配 图 
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分 配 边 ( allocation edge, al) 是 从 资源 到 进程 ， 表 示 该 资源 分 配给 了 该 进程 。 在 图 中 ， 
标记 为 al 的 从 CD 驱动 器 到 P1 的 边 的 含义 是 操作 系统 把 CD 驱动 器 分 配给 了 进程 P1。 请 求 
边 (request edge, req) 是 从 进程 到 资源 ， 意 思 是 进程 被 阻塞 了 ， 正 在 等 待 该 资源 。 标 记 为 
req 的 从 P2 到 CD 驱动 器 的 边 的 含义 是 P2 被 阻塞 在 了 对 CD 驱动 器 的 等 待 上 。 

边 组 成 了 一 个 闭合 的 路 径 ， 从 P1 到 P2 到 RI 再 回 到 Pl1， 死 锁 就 很 明显 地 能 看 出 来 。 
图 中 这 样 的 一 个 闭合 回路 称 为 循环 (cycle)。 资 源 分 配 图 中 的 循环 表明 一 个 进程 阻塞 在 一 个 
资源 上 ， 因 为 该 资源 分 配给 了 男 一 个 进程 ， 而 它 阻 塞 在 男 一 个 资源 上 ， 以 此 类 推 , 最 后 一 个 
资源 分 配给 了 第 一 个 进程 。 如 果 循 环 不 能 被 打破 ， 就 出 现 了 和 死 锁 。 

有 时 一 类 中 的 资源 是 不 做 区 分 的 ， 进 程 可 以 请 求 某 类 资源 中 的 一 个 ， 而 不 关心 具体 是 哪 
一 个 ， 因 为 资源 都 是 等 价 的 。 比 如 ， 有 一 组 CD 驱动 器 ， 或 者 一 组 同样 的 激光 打印 机 。 如 果 
进程 需要 一 个 激光 打印 机 而 不 在 意 是 其 中 的 哪 一 个 ， 那 么 操作 系统 就 可 以 把 任意 一 个 空闲 的 
打印 机 分 配给 它 。 

资源 分 配 图 用 长 方形 方 框 中 的 个 实心 点 表示 同一 类 n 个 等 价 的 资源 。 当 操作 系统 分 配 
一 个 该 类 资源 时 ， 分 配 边 从 代表 一 个 资源 的 某 个 点 发 出 。 不 过 请 求 边 指 回 方 框 ， 因 为 请 求 进 
程 不 在 意 它 获 得 的 是 这 类 资源 中 的 哪 一 个 。 

图 8-32a 中 RI 资源 类 中 的 两 个 资源 都 已 经 分 配 出 去 了 ，P1 有 一 个 对 该 类 资源 未 被 满足 
的 请 求 ， 它 不 在 意 获 得 哪 一 个 资源 。 


me AA 
t im Bii 
a) 初始 状态 b) P4 完 成 c) P2 完 成 


8-32 ”有 循环 但 是 没有 死 锁 的 资源 分 配 图 


虽然 这 张 图 有 循环 (Pl1，R1，P3，R3，P1 ), 但 是 没有 死 锁 ， 因 为 这 个 循环 是 可 以 被 
打破 的 。 资 源 分 配 图 中 任意 一 个 进程 如 果 没 有 请 求 边 ， 那 么 它 就 没有 被 阻塞 。 这 张 图 中 P4 
是 未 被 阻塞 的 ， 可 以 想象 它 最 终 会 执行 完毕 ， 释 放 R2。 操 作 系 统 RI 
会 满足 P2 对 R2 的 请 求 ， 把 从 P2 到 R2 的 请 求 边 改 为 从 R2 到 P2 (P2) 
的 分 配 边 ， 如 图 8-32b 所 示 。 

现在 P2 能 够 使 用 R2 和 RI1， 可 以 运行 完成 ， 最 终 释放 这 些 si 
资源 。 当 P2 释放 一 个 R1 资源 时 ， 操 作 系统 可 以 把 该 资源 分 配给 
P1， 得 到 图 8-32c。P1 拥有 它 需 要 的 所 有 资源 ， 可 以 运行 完成 ， 之 
后 P3 也 可 以 完成 了 。 所 有 的 进程 都 可 以 完成 ， 所 以 没有 死 锁 。 

在 寻找 循环 的 过 程 中 ， 一 定 要 考虑 边 的 方向 。 你 可 能 会 把 图 8.33 没有 循环 因此 也 
图 8-33 中 的 (R1, P1, R2, P2, R1) 当 作 循环 ,但 是 它 并 不 是 。 没有 死 锁 的 资源 
没有 从 R2 到 P2 的 边 ， 也 没有 从 P2 到 R1 的 边 。 循 环 是 死 锁 的 必 分 配 图 
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要 但 是 非 充分 条 件 。 在 这 张 图 中 ， 没 有 循环 ， 所 以 也 没有 和 死 锁 。 


8.4.2 FRR 


操作 系统 可 以 采用 下 列 3 种 通用 策略 中 的 一 种 来 处 理 死 锁 : 

e 预防 

© 发 现 并 恢复 

e 无 视 

某 个 操作 系统 中 可 能 有 多 种 不 同 的 策略 。 系 统 可 以 为 一 组 资源 使 用 一 种 策略 ， 而 为 另外 
一 组 资源 使 用 另 一 种 策略 。 

预防 策略 是 采用 技术 保证 不 会 出 现 死 锁 。 一 种 技术 是 要 求 运 行 完 成 所 需 的 所 有 资源 ， 在 
执行 开始 时 作业 请 求 和 分 配 一 次 完成 。 如 果 P1 同时 获得 R1 和 R2， 那 么 图 8-31 中 的 死 锁 是 
不 会 产生 的 。 只 有 一 个 进程 被 分 配 了 某 个 资源 ， 然 后 又 请 求 另外 的 资源 ， 形 成 一 个 循环 ， 才 
可 能 发 生死 锁 循环 。 

发 现 并 恢复 策略 允许 发 生死 锁 。 采 用 这 种 策略 时 ， 操 作 系 统 将 周期 性 地 执行 一 个 检测 系 
统 中 死 锁 循 环 的 程序 。 如 果 操 作 系 统 发 现 死 锁 ， 就 拿 走 循环 中 一 个 进程 所 占用 的 一 个 资源 。 
因为 进程 可 能 已 经 执行 了 一 部 分 ， 所 以 操作 系统 通常 必须 终止 该 进程 ， 除 非 稍 后 当 该 进程 再 
获得 该 资源 时 ， 资 源 的 状态 还 能 重建 。 

所 有 的 这 些 策 略 都 是 有 代价 的 。 预 防 策略 对 用 户 有 所 限制 ， 特 别 是 ， 如 果 进 程 所 需 资源 
是 依赖 于 输入 无 法 事先 知道 的 时 候 。 在 发 现 并 恢复 策略 中 ， 发 现 和 恢复 算法 需要 占用 CPU 
时 间 ， 这 些 时 间 就 不 能 用 在 用 户 作 业 上 。 

第 三 种 策略 就 是 无 视 死 锁 。 如 果 认 为 其 他 策略 的 开销 都 太 大 ， 而 发 生死 锁 的 概率 又 很 
小 ， 或 者 出 现 死 锁 的 后 果 并 不 严重 ， 选 用 这 种 策略 就 比较 有 效率 。 例 如 ， 某 个 分 时 系统 会 定 
期 关机 进行 例 行 维护 ， 每 次 关机 时 所 有 的 作业 都 会 被 清除 ， 包 括 那 些 死 锁 的 作业 。 


AA 


操作 系统 的 目标 是 向 高 级 编程 提供 方便 的 环境 并 高 效 地 分 配 系统 资源 。 操 作 系 统 的 一 项 
重要 功能 是 管理 用 户 提交 要 执行 的 作业 。 装 载 器 是 操作 系统 的 一 部 分 ， 它 把 作业 放 人 内存 进 
行 执 行 。 在 作业 完成 执行 之 后 ， 它 把 CPU 的 控制 返回 给 操作 系统 ， 操 作 系 统 可 以 继续 加 载 
其 他 的 应 用 程序 。 

陷阱 处 理 程 序 为 作业 执行 一 些 处理 操 作 ， 回 程序 员 隐 藏 低层 的 细节 。 当 陷阱 发 生 时 ， 正 
在 运行 的 作业 的 进程 控制 块 (PCB) 被 存储 起 来 ， 同 时 操作 系统 啊 应 并 服务 该 中 断 。PCB 由 
进程 的 状态 组 成 ， 包 括 程序 计数 器 、 状 态 位 和 所 有 CPU 寄存 器 的 内 容 的 副本 。 要 继续 执行 
该 作业 时 ， 操 作 系 统 把 PCB 放 回 CPU 中 。 异 步 中 断 的 运行 和 过 程 调 用 类 似 ， 只 不 过 中 断 是 
由 操作 系统 发 起 ， 而 不 是 由 应 用 程序 员 的 代码 发 起 。 

进程 是 执行 时 的 程序 。 在 多 道 程序 设计 系统 中 ，CPU 在 多 个 进程 间 切 换 。 在 多 处 理 系 
统 中 ， 有 不 止 一 个 CPU。 多 道 程 序 设 计 和 多 处 理 系 统 中 都 有 并 发 执行 的 进程 。 并 发 地 执行 
协作 的 进程 ， 操 作 系统 必 须 能 够 保证 对 临界 区 的 互 斥 访问 ， 并 避免 死 锁 Peterson 算法 满足 
这 两 个 要 求 。 信 号 量 是 操作 系统 提供 的 整数 型 变量 ， 对 它 的 操作 包括 wait A signal, ix 
些 操作 都 是 原子 的 或 者 说 是 不 可 分 割 的 。 信 和 号 量 可 以 用 来 满足 互 斥 和 不 出 现 死 锁 。 

当 进 程 共享 操作 系统 提供 的 资源 时 ， 也 有 可 能 出 现 死 锁 。 资 源 分 配 图 由 代表 资源 和 进 
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程 的 结 点 组 成 ， 结 点 间 的 边 表示 资源 分 配 和 请 求 。 如 果 资 源 分 配 图 中 包含 有 不 能 被 打破 的 循 
环 ， 就 表示 发 生 了 死 锁 。 


练习 


8.1 节 


sA 


操作 系统 的 两 大 目标 是 什么 ? 
图 8-3 中 的 装载 右 执 行 下 列 输入 : 


04 00 05 00 00 31 00 03 39 00 03 50 00 OA 41 00 
12 00 54 68 61 74 27 73 20 61 6C 6C 2E OA 00 zz 


假设 从 FCSD 到 FC97 的 循环 执行 到 第 27 次 ， 以 4 个 十 六 进 制 数字 的 格式 说 明 下 列 寄存 器 中 的 值 : 


* (a) 在 F6C0 的 LDA 之 后 的 A * (b) 在 FC72 的 ASLA 之 前 的 A 
* (c) Æ FC75 的 ASLA 之 后 的 A (d) Æ FC7C 的 LDA 之 后 的 A 
(e) 在 FC88 的 ANDA 之 后 的 A (f) Æ FC8B 的 ORA 之 后 的 A 


(g) 在 FC91 的 ADDX 之 后 的 X 


3. 对 于 循环 第 29 次 执行 时 的 情况 ， 再 做 一 遍 练习 2。 
8.2 5 
4. 下 面 的 程序 执行 时 ， 产 生 一 个 DECI PET: 
0000 040005 BR main ;Branch around data 
0003 0000 num: :BLOCK 2 :Global variable 
0005 310003 main: DECI num, d ;Input decimal value 
0008 390003 DECO num, d ;Output decimal value 
000B 50000A CHARO tyad 
000E 410012 STRO msg, d ;Output message 
0011 00 STOP 
0012 546861 msg: .ASCII “That’s all.\n\x00" 
742773 
20616C 
6C2E0A 
00 
001F . END 


* 


* 


N A U 


根据 图 8-6， 进 入 和 退出 该 陷阱 处 理 程序 ， 以 4 个 十 六 进 制 数字 的 格式 说 明 下 列 寄存 器 中 的 值 : 
* (a) 在 FC9E 的 LDBYTEX 之 后 的 X * (b) 在 FCB9 的 ASRX 之 后 的 X 

(c) 在 FCBA 的 SUBX 之 后 的 X (d) 在 FCBE 的 CALL 之 后 的 PC 

(e) Æ FCC1 的 RETTR 之 后 的 PC 


.对 于 DECO 指令 再 做 一 裔 练习 4。 
.对 于 STRO 指令 再 做 一 遍 练 习 4。 


以 输入 37 运行 练习 4 中 的 程序 。 根 据 图 8-14, DECI 陷阱 处 理 程序 ， 以 4 个 十 六 进 制 数 字 的 格式 
说 明 (a)- (h) 中 寄存 器 的 值 ， 并 回答 (i) 中 的 问题 : 
* (a) 在 第 一 次 执行 FDEB 的 ANDA 之 后 的 A, 
* (b) 在 第 二 次 执行 FDEB 的 ANDA 之 后 的 A。 
* (c) 在 第 一 次 执行 FDF4 的 LDX 之 后 的 Xo 
(d) 在 第 二 次 执行 FDF4 的 LDX 之 后 的 x。 
(e) 在 第 一 次 执行 FDF8 的 BR 之 后 的 PC。 
(£) 在 第 二 次 执行 FDF8 的 BR 之 后 的 PC。 
(g) 在 FEE9 的 LDA 之 后 的 A。 
(h) 在 执行 FF04 的 STBYTEX 之 前 的 X， 假 设 在 陷阱 发 生 之 前 进位 位 为 0。 
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(i) 在 FEC7 的 LDA 执行 之 前 执行 的 是 什么 语句 ? 
*8. 对 于 输入 -295 再 做 一 遍 练习 7。 
9. 以 输入 37 运行 练习 4 中 的 程序 。 根 据 图 8-15，DECO 陷阱 处 理 程序 ， 以 4 个 十 六 进 制 数字 的 格式 


说 明 下 述 寄 存 器 的 值 : 

* (a) 在 FF4A 的 LDA 之 后 的 A * (b) 在 FFS7 的 STA 之 后 的 A 
对 于 下 面 的 问题 ， 假 设 在 FF78 的 CALL 调用 的 是 子 例 程 divide: 

* (c) 在 FF91 的 LDA 之 后 的 A (d) Æ FFA6 AY CPX 之 前 的 X 


(e) 在 FFBC 的 LDA 之 后 的 A 
对 于 下 面 的 问题 ， 假 设 在 FF81 的 CALL 调用 的 是 子 例 程 divide: 
(f) Æ FF91 的 LDA 之 后 的 A (g) 在 FFA6 的 CPX 之 前 的 X 
(h) 在 FFBC 的 ORX 之 后 的 X 
10. 对 于 输入 -2068 再 做 一 遍 练习 9。 
11. 运行 练习 4 中 的 程序 ， 执 行 STRO 指令 。 根 据 图 8-16, STRO 陷阱 处 理 程序 ， 以 4 个 十 六 进 制 数字 


的 格式 说 明 下 述 寄 存 器 的 值 : 
(a) Æ FFD2 的 LDA 之 后 的 A (b) 在 第 一 次 执行 FFE8 的 LDBYTEA 之 后 的 A 
(c) 在 第 一 次 执行 FFF1 的 ADDX 之 后 的 X (d) 在 第 5 次 执行 FFE8 的 LDBYTEA 之 后 的 A 


(e) 在 第 5 次 执行 FFF1 的 ADDX 之 后 的 Xx 

12. 执行 图 5-11 中 地 址 0005 处 采用 直接 寻 址 方式 的 DECI 指令 ， 产 生 一 个 陷阱 ， 陷 阱 处 理 程序 调用 
图 8-10 的 setAddr 例 程 。 以 4 个 十 六 进 制 数字 的 格式 说 明 变 址 寄存 器 的 值 : 
(a) 在 FD3D 的 LDX 之 后 (b) 在 FD40 的 SUBX 之 后 (c) Æ FD43 的 LDX 之 后 

13. 执行 图 6-41 中 地 址 0048 处 采用 间接 寻 址 方式 的 DECO 指令 ， 产 生 一 个 陷阱 ， 陷 阱 处 理 程序 调用 
图 8-10 的 setAddr HF, A 4 个 十 六 进 制 数字 的 格式 说 明 变 址 寄存 器 的 值 : 
(a) 在 FD4A 的 LDX 之 后 (b) 在 FD4D 的 SUBX 之 后 
(c) 在 FD50 的 LDX 之 后 (d) 在 FD53 的 LDX 之 后 

14. 执行 图 6-4 中 地 址 0009 处 采用 栈 相对 寻 址 方式 的 DECI 指令 ， 产生 一 个 陷阱 ， 陷 阱 处 理 程 序 调用 
图 8-10 的 setAddr 例 程 。 以 4 个 十 六 进 制 数字 的 格式 说 明 变 址 寄存 右 的 值 : 
(a) 在 FD5A 的 LDX 之 后 (b) 在 FD5D 的 SUBX 之 后 
(c) Æ FD60 的 LDX 之 后 (d) 在 FD63 的 LDX 之 后 

15. 第 二 次 执行 图 6-36 中 地 址 0013 处 采用 栈 变 址 寻 址 方式 的 DECI 指令 ， 产 生 一 个 陷阱 ， 陷 阱 处 理 程 
序 调用 图 8-10 的 setAddr 例 程 。 以 4 个 十 六 进 制 数字 的 格式 说 明 变 址 寄存 器 的 值 : 
(a) Æ FD8D 的 LDX 之 后 (b) Æ FD90 的 SUBX 之 后 (c) 在 FD93 的 LDX 之 后 
(d) 在 FD96 的 ADDX 之 后 (e) Æ FD99 的 ADDX 之 后 

16. 第 二 次 执行 图 6-38 中 地 址 0016 处 采用 栈 变 址 间接 寻 址 方式 的 DECI 指令 ， 产 生 一 个 陷阱 ， 陷 阱 处 
理 程序 调用 图 8-10 的 setAddr 例 程 。 以 4 个 十 六 进 制 数 字 的 格式 说 明 变 址 寄存 器 的 值 : 


(a) 在 FDA0 的 LDX 之 后 (b) 在 FDA3 的 SUBX 之 后 (c) Æ FDA6 的 LDX 之 后 
(d) Æ FDA9 的 ADDX 之 后 (e) Æ FDAC 的 LDX 之 后 (f) Æ FDAF ÉJ ADDX 之 后 
8.3 $ 
17. 图 8-23 中 的 交错 执行 序列 可 以 简写 为 112221， 表 示 图 8-22 P P1, P1, P2, P2, P2, Pl 执行 的 
语句 。 | 
(a) 有 多 少 种 可 能 的 、 不 同 的 执行 序列 ? 用 简写 法 列 出 每 种 可 能 的 序列 。 对 于 每 个 序列 ， 说 明 
numRes 是 否 有 正确 的 值 。 


(b) 所 有 可 能 的 序列 中 有 百 分 之 多 少 产 生 不 正确 争取 的 结果 ? 
(c) 这 个 比例 是 否 就 是 程序 运行 时 可 能 得 到 不 正确 结果 的 概率 ?请 解释 。 
18. 下 面 这 段 代码 尝试 实现 临界 区 ， 类 似 于 图 8-26 中 的 程序 ， 除 了 入 口 段 中 语句 的 顺序 不 一 样 外 : 


20. 


FA P 


2 


2 


2 


N 


U3 


D 


进程 Pl 
do 
while (enter2) 
; //nothing 
enterl = TRUE 
critical section 


enterl = FALSE; 


remainder section 
while (! donel); 


* (a) 这 个 算法 能 保证 互 斥 吗 ? 如 果 不 能 ， 给 出 一 个 执行 序列 使 得 两 个 进程 能 同时 进入 它们 的 临界 区 。 
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进程 P2 

do 
while (enter1) 

; //nothing 

enter2 = TRUE 
critical section 
enter2 = FALSE; 
remainder section 


while (! done2); 


(b) 该 算法 能 预防 死 锁 吗 ? 如 果 不 能 ， 给 出 能 导致 Pl1 和 P2 死 锁 的 执行 序列 。 


.根据 wait 和 signal 的 定义 ， 解 释 s 的 大 小 是 被 阻塞 进程 的 数量 。 
I 表示 执行 init(s)，W 表示 wait(s)， 而 S 表示 signa1(s)。 例如 ，IWWS 表示 操作 系统 中 革 
些 进程 的 调用 序列 为 init(s)、wait(s)、wait(s) 和 signal(s)。 对 于 下 面 每 个 调用 序列 ， 说 


明 s 的 值 和 序列 中 最 后 一 个 调用 执行 后 被 阻塞 的 进程 数量 : 


* (a)IW (b)IS (c) ISSSW (d) IWWWS (e) ISWWWW 
假设 3 个 并 发 的 进程 执行 下 面 的 代码 : 
进程 Pl 进程 P2 进程 P3 
do do do 
wait(mutEx); wait(mutEx); wait(mutEx); 
critical section critical section critical section 
Signal (mutEx); Signal (mutEx); signal (mutEx); 
remainder section remainder section remainder section 
while (! donel); while (! done2); while (! done3); 


解释 该 代码 如 何 保证 对 这 3 个 临界 区 的 访问 是 互 斥 的 。 


进程 Pl 
wait(s); 
wait(t); 
critical section 
signats): 
signal(t); 
remainder section 








进程 P2 
wait(t); 
wait(s); 





.假设 s At 是 两 个 信号 量 , 用 init(s) 和 init(t) 初始 化 。 考 虑 下 面 两 段 并 发 进程 代码 : 


critical section 
Ssignal(t); 
Signal(s); 
remainder section 


* (a) BRIERE RIES? 如 果 不 能 ， 给 出 一 个 执行 序列 使 得 两 个 进程 能 同时 进入 它们 的 临界 区 。 
(b) 该 算法 能 预防 死 锁 吗 ? 如 果 不 能 ， 给 出 能 导致 P1 和 P2 死 锁 的 执行 序列 。 





. 考虑 下 面 两 段 并 发 进程 代码 : 
进程 Pl 进程 P2 
语句 ] 语句 4 
语句 2 语句 5 
语句 3 语句 6 


修改 这 段 代码 保证 语句 5 在 语句 2 之 前 执行 。 用 信号 量 实现 。 


.下 面 每 段 代码 在 入口 段 或 出 口 段 中 包含 一 个 漏洞 。 说 明 每 段 代 码 是 否 能 保证 互 斥 。 如 果 不 能 ， 给 出 


会 违反 互 斥 的 执行 序列 。 说 明 是 否 会 出 现 死 锁 。 如 果 会 ， 给 出 相应 的 执行 序列 。 


wait(mutEx); 
critical section 
Signal (mutEx); 
remainder section 
while (! donel); 


进程 P2 

do 
signal (mutEx); 
critical section 
wait(mutEx); 
remainder section 

while (! done2); 
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(b) 

进程 Pl 

do 
signal(mutEx); 
critical section 
wait(mutEx); 
remainder section 

while (! donel); 


(c) 

进程 Pl 

do 
wait(mutEx); 
critical section 
signal (mutEx); 
remainder section 

while (! donel); 


(d) 

进程 Pl 

do 
wait(mutEx); 
critical section 
Signal (mutEx); 
remainder section 

while (! donel); 


(e) 
it #2 Pl 


do 


Bé 





wait(mutEx); 
critical section 
signal(mutEx); 
remainder section 
while (! donel); 


RI AGRE (#44) 


进程 P2 

do 
Signal (mutEx); 
critical section 
wait(mutEx); 
remainder section 

while (! done2); 


进程 P2 

do 
wait(mutEx); 
critical section 
wait(mutEx); 
remainder section 

while (! done2); 


进程 P2 

do 
wait(mutEx); 
critical section 
remainder section 

while (! done2); 


进程 P2 

do 
critical section 
signal (mutEx); 
remainder section 

while (! done2); 


8.4% 

25. 一 个 操作 系统 中 有 进程 P1、P2、P3 和 了 P4， 资 源 R1 (一 个 )、R2 (一 个 )、R3 (2%) 和 R4 (3%). 
(1, 1). (2, 2), (1, 2) 表示 P1 请 求 R1， 然 后 P2 请 求 R2， 然 后 Pl 请 求 R2。 注 意 ， 前 两 个 请 
求 在 资源 分 配 图 上 生成 两 条 分 配 边 ,但 是 第 三 个 请 求生 成 一 条 请 求 边 ， 因 为 R2 已 经 分 配给 了 P2。 
画 出 下 面 每 个 请 求 序列 执行 后 的 资源 分 配 图 ， 说 明 每 个 资源 分 配 图 是 否 包含 循环 。 如 果 有 ， 说 明 是 
否 是 死 锁 循环 。 


*(a) (1, 1), (2, 2), (1, 2), (2, 1) 
*(b) (1, 4), (2, 4), (3, 4), (4, 4) 
(c) (1, 1), (2, 1), (3, 1, 4, 1) 
(d) (3, 3), (4, 3), (2, 2), (3, 2), (2, 3) 
(e) (1, 2), (1, 3), (1, 4), (2, 2), (2, 3), (2, 4) 
(f) (2, 1), (1,2), (2,3),.G, 3), 2), (1,3) 
(g) (2, 1), (1, 2), (2, 3), (3, 3), (2, 2), (1, 3), (3, 1) 
(h) (1, 4), (2, 3), (3, 3), (2, 1), (3, 4), (1, 3), (4, 4), (3, 1), (2, 4) 
(1) (1, 4), (2, 3), (3, 3), (2, 1), (3, 4), (1, 3), (4, 4), (3, 1), (2, 4), (4, 3) 


问题 
8.2% 


26. 实现 一 条 新 的 一 元 指令 ,替代 NoP0， 称 为 AsL2， 它 把 累加 器 左 移 2 位 。V 位 应 该 保持 不 变 ，N 位 
和 Z 位 应 该 和 累加 器 中 的 新 值 保持 一 致 ，C 位 应 该 是 第 二 次 移 位 的 进位 值 。 写 一 个 程序 检测 新 指令 


p 


28. 


29. 


30. 


3 


一 一 


32 


33; 


的 所 有 特性 - 


实现 一 条 新 的 一 元 指令 ， 
数 、 直 接 和 栈 相对 寻 址 . 
最 后 一 次 移 位 的 进位 值 。 
实现 一 条 新 的 一 元 指令 ， 


代替 NOP ， 称 为 ASLMANY .人 它 的 操作 数 是 累加 器 左 移 的 次 数 。 人 允许 立即 
V 位 应 保持 不 变 ，N 位 和 ZZ 位 应 该 和 累加 器 中 的 值 保持 一 致 ，C 位 应 该 是 
写 一 个 程序 检测 新 指令 的 所 有 特性 。 

替代 NOP ， 称 为 MULA， 它 把 累加 器 乘 以 操作 数 ， 结 果 放 入 累加 器 中 。 允 


许 立 即 数 、 直 接 和 栈 相 对 寻 址 。V 和 C 位 应 保持 不 变 . N 位 和 Z 位 应 该 和 累加 堪 中 的 值 保持 一 致 。 
写 一 个 程序 检测 新 指令 的 所 有 特性 。 

直接 寻 址 就 是 立即 数 寻 址 再 间接 寻 址 ， 间 接 寻 址 就 是 直接 寻 址 再 间接 寻 址 。 把 这 个 概念 再 进一步 
推论 ， 两 次 间接 寻 址 ， 也 就 是 间接 寻 址 再 在 间接 半 址 ”实现 一 条 新 指令 ， 蔡 代 NOP0， 其 助 记 符 为 
STADI, 代表 Store Accumulator Double Indirect (存储 累加 器 ， 两 次 间接 寻 址 )。 它 使 用 
两 次 间接 寻 址 来 存储 累加 右 。 执 行 下 面 的 程序 来 测试 你 的 指令 。 


0000 04000F 


0003 0000 numl : 
0005 0003 numlad: 
0007 0005 numladad: 
0009 0000 num2: 
000B 0009 num2ad: 
000D 000B num2adad: 
OOOF COO001B main: 
0012 24 

0013 0007 

0015 C00022 

0018 24 

0019 000D 


对 于 汇编 器 和 CPU 来 说 ，NOP0 是 一 条 一 元 指令 ， 但 是 你 的 程序 必须 把 它 实现 为 非 一 元 指令 。 需 要 


BR main 

.BLOCK 2 :numl 

.ADDRSS numl :Address of numl 

.ADDRSS numlad ;Address of address of numl 
-BLOCK 2 ;num2 

-ADDRSS num2 ;Address of num2 

.ADDRSS num2ad ;Address of address of num2 
LDA ef 24 ;Load accumulator 

STADI ;Store numl double indirect 
.ADDRSS numladad 

LDA 34,7 ;Load accumulator 

STADI ;Store num2 double indirect 
.ADDRS9 num2adad 

DECO numl,d ;Output numl 

CHARO Da 

DECO num2,d ;Output num2 

CHARO PANE i 

STOP 

. END 


对 保存 的 PC 加 1 以 跳 过 操作 数 指示 符 。 


实现 一 条 新 的 一 元 指令 ， 蔡 代 NOP， 称 为 HEX0， 它 以 十 六 进 制 形 式 输出 操作 数 。 人 允许 立即 数 、 直 


接 和 栈 相对 寻 址 。 写 一 个 程序 检测 新 指令 的 所 有 特性 。 


.实现 一 条 新 的 一 元 指令 ,替代 NOP ， 称 为 B00L0， 意 思 是 输出 布尔 值 。 如 果 操 作 数 为 0， 输 出 


false, ATMS true。 人 允许 立即 数 、 直 接 和 栈 相 对 寻 址 。 写 一 个 程序 检测 新 指令 的 所 有 特性 。 


实现 一 条 新 的 一 元 指令 
代码 自 

LDA 5.7 

STA 24S 

LDA 9,7 

STA AS 
SUBSP 44 
STACKADD 

DECO 0,s 

ADDSP fie | 


应 该 输出 5 和 9 的 和 。 


, FAC NOP0， 称 为 STACKADD， 它 把 栈 顶 最 高 两 项 蔡 换 为 它们 的 和 。 例 如， 


;Push 5 
;Push 9 
:Add 5 + 9 


;Output top of stack 
;Pop the sum 


本 问题 实现 一 条 新 的 、 处 理 浮 点 数 的 、 非 一 元 指令 。 假 设 浮 点 数 除 了 单元 占用 2 字 节 , 1 位 符号 位 ， 
6 位 指数 位 ，9 位 位 数位 和 一 个 隐藏 位 之 外 ， 其 他 的 都 遵循 IEEE 754 标准 。 指 数 采 用 余 31 码 表示 ， 
而 非 规格 化 数 采 用 余 30 人 码 。 
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(a) 实现 一 条 新 的 一 元 指令 ， 替代 DECc0， 称 为 BINF0， 表 示 二 进 制 浮 点 输出 。 人 允许 和 DECO 同样 
的 寻 址 方式 。 值 3540 (hex) 表示 规格 化 数 1.101 x 25， 应 该 输出 1.101000000b011010， 这 里 字 
母 b 表示 是 2 的 宪 数 ,，b 后 面 的 位 序列 是 -5 的 余 30 码 表示 。 值 0050 (hex)， 表 示 非 规格 化 数 
0.001 01 x2 "， 应 该 输出 为 0.001010000b-30， 这 里 对 非 规格 化 数 来 说 ， 寡 数 总 是 为 -30。 如 果 
值 为 NaN， 那 么 就 输出 NaN， 正 无 穷 大 输出 inf， 负 无 穷 大 输出 -inf。 

(b) 实现 一 条 新 指令 ， 替 代 DECI， 称 为 BINFI， 表 示 二 进 制 浮 点 输入 。 人 允许 和 DECI 同样 的 寻 址 - 
方式 。 假 设 输入 总 是 规格 化 二 进 制 数 。 输 入 1.101000000b011010， 表 示 规 格 化 数 1.101 x 2°, 
应 该 存储 为 3540 (hex)。 

(c) 实现 一 条 新 一 元 指令 ,替代 NOP ， 称 为 ADDFA， 表 示 浮 点 累加 器 加 法 。 人 允许 与 ADDA 同样 的 寻 
址 方式 。 对 于 规格 化 和 非 规格 化 数 ， 都 假设 两 个 加 数 的 指数 字段 是 相同 的 ， 但 是 和 的 指数 字段 不 
一 定 要 和 初始 的 指数 字段 相同 。 你 的 实现 需要 在 执行 加 法 之 前 插 人 隐藏 位 ， 存 储 结果 之 前 去 除 隐 
藏 位 。 考 虑 操作 数 中 的 一 个 或 者 两 个 可 能 为 NaN 或 者 无 限 的 情况 。 

(d) 假设 规格 化 数 或 者 非 规格 化 数 的 指数 字段 可 能 不 相同 的 情况 ， 再 做 一 遍 (e) 部 分 的 问题 。 
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操作 系统 的 目的 是 为 高 级 编程 提供 更 加 方便 的 环境 ， 并 有 效 分 配 系统 资源 。 第 8 章 介绍 了 
操作 系统 如 何 为 系统 中 的 进程 分 配 CPU 时 间 ， 而 本 章 将 介绍 它 是 如 何 分 配 存 储 空间 的 。 存 储 
空间 主要 分 为 两 类 : 主 存 和 外 围 存 储 。 磁 盘存 储 是 最 常见 的 外 围 人 存储， 也 是 本 章 将 要 描述 的 。 


9.1 内 存 分 配 


没有 在 执行 的 程序 通常 存在 磁盘 文件 中 。 要 执行 程序 就 需要 主 存 空间 和 CPU 时 间 。 操 
作 系 统 把 程序 从 磁盘 加 载 到 主 存 ， 为 程序 分 配 空间 ; 把 程序 计数 器 设置 为 加 载 到 内 存 里 的 第 
一 条 指令 的 地 址 ， 为 程序 分 配 时 间 。 

本 章 前 两 节 讲 述 分 配 主 存 空间 的 5 种 技术 : 

e 单 道 程序 设计 (uniprogramming ) 

e 固定 分 区 多 道 程序 设计 (fixed-partition multiprogramming ) 

e 可 变 分 区 多 道 程序 设计 (variable-partition multiprogramming ) 

e 分 页 (paging ) 

e HUA (virtual memory) 
这 些 技术 按照 列 出 的 顺序 依次 变 得 复杂 ， 每 一 项 都 解决 了 一 个 性 能 问题 ， 是 对 上 一 项 技术 的 
改进 。 本 书 没 有 讨论 第 六 种 技术 一 一 分 段 。 


9.1.1 单 道 程序 设计 


最 简单 的 内 存 分 配 技术 是 单 道 程序 设计 ，Pep/8 操作 系统 就 是 这 样 的 例子 。 操 作 系 统 驻 
留 在 内 存 的 一 端 ， 应 用 程序 在 男 一 端 。 系 统一 次 只 执行 一 个 作业 。 

因为 每 个 作业 都 加 载 在 同一 个 位 置 ， 所 以 翻译 右 也 会 相应 地 生成 目标 代码 。 例 如 Pep/8 
汇编 器 假设 第 一 个 字 节 加 载 到 地 址 0000 (hex) ， 然 后 从 符号 表 计 算 符号 地 址 。 或 者 ， 如 果 程 
序 包 含 一 个 burm (A) 指示 符 ， 则 汇编 器 假设 最 后 一 个 字 节 将 加 载 到 内 存 底 部 的 地 址 。 

单 道 程序 设计 有 优点 也 有 缺点 。 主 要 优点 体现 在 大 小 方面 。 这 样 的 系统 可 以 很 小 ， 设 计 
简单 ， 因 此 不 容易 出 错 ， 执 行 起 来 几乎 没有 开销 。 应 用 程序 一 旦 加 载 进 来 ， 就 会 100% 占用 
处 理 器 的 时 间 ， 因 为 没有 其 他 进程 会 中 汤 它 。 单 道 程序 设计 系统 适用 于 骸 入 式 系 统 。 

单 道 程序 设计 的 主要 缺点 是 CPU 时 间 利 用 率 很 低 ， 而 且 作 业 调 度 很 不 灵活 。 相 比 起 主 
存 ， 磁 盘存 储 的 访问 时 间 较 长 。 如 果 应 用 程序 从 硬盘 读数 据 ，CPU 会 一 直 空 闲 ， 等 竺 磁盘 
输入 。 这 段 时 间 如 果 能 用 来 执行 其 他 用 户 的 作业 就 会 更 好 。 对 于 一 台 微 型 计算 机 来 说 ， 可 以 
容忍 浪费 一 些 CPU 时 间 ， 但 是 对 于 花费 几 十 万 的 计算 机 来 说 就 不 能 忍受 了 ， 特 别 是 在 多 用 
户 系统 中 ， 进 程 是 并 发 执行 的 ， 那 就 更 不 能 忍受 了 。 

其 至 在 单一 用 户 系统 中 ， 作 业 调 度 不 灵活 也 是 很 讨厌 的 。 用 户 可 能 想 要 启动 两 个 程序 ， 
并 在 两 者 之 间 来 回 切换 而 不 退出 任何 一 个 。 例 如 ， 你 可 能 想 要 运行 一 会 儿 字 处 理 程序 ， 然 后 
再 切换 到 画图 程序 画 文档 的 插图 ， 然 后 再 切换 回 字 处 理 程序 继续 刚才 的 文字 编辑 。 
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91.2 固定 分 区 多 道 程序 设计 
多 道 程序 设计 允许 并 发 运行 多 个 应 用 ， 解决 了 CPU 利用 率 不 足 的 问题 。 要 在 两 个 进程 


间 进 行 切 换 ， 操 作 系 统 就 要 把 两 个 程序 都 加 载 进 主 存 。 当 运行 进 一 

程 被 挂 起 时 ， 操 作 系统 会 把 它 的 进程 控制 块 存储 起 来 ， 然 后 再 把 ae 

CPU 交 给 另 一 个 程序 | 8 | 
要 实现 多 道 程序 设计 ， 操 作 系统 需要 把 主 存 划 分 成 不 同 的 分 


区 ， 分 别 存 储 不 同 的 正在 执行 的 进程 。 在 固定 分 区 方案 中 ， 操 作 系 
统 把 内 存 分 成 几 个 大 小 和 位 置 不 会 随时 间 改 变 的 分 区 。 图 9-1 给 出 
了 一 种 可 能 的 划分 ， 这 是 一 个 主 存 大 小 为 64 KB 的 固定 分 区 多 道 32 
程序 设计 系统 。 操 作 系 统 占 用 内 存 底部 的 16KB。 它 假设 作业 的 大 
小 并 不 都 一 样 ， 所 以 把 剩余 的 48 KB 划分 为 2 个 4KB 的 分 区 、1 


个 8KB 的 分 区 和 1 个 32KB 的 分 区 。 48 
为 不 同 进程 提供 不 同 的 内 存 分 区 会 带 来 一 个 问题 ， 那 就 是 目标 
代码 中 的 内 存 引用 必须 进行 相应 的 调整 。 假设 汇 编 语言 程序 员 写 了 


一 个 程序 ， 大 小 为 20KB， 操作 系统 把 它 装 载 进 一 个 32KB 的 分 区 。 64 
如 果 汇 编 器 假设 目标 代码 会 被 加 载 进 从 地 址 0 开始 的 内 存 ， 那 么 所 图 9-1 一 个 64 KB 主 存 
有 内 存 引用 就 都 错 了 。 thereat 
See 区 大 小 和 地 址 
例如 ， 假 设 代 码 开 始 的 几 行 是 MKB Bf. 
0000 040005 BR AbsVal 操作 系统 占据 底 


0003 0000 number: .BLOCK 2 
0005 310003 AbsVal: DECI number ,d 


汇编 项 把 符号 AbsVal 的 值 计算 为 0005， 因 为 BR 是 一 条 3 字 节 指令 ，number 占用 2 个 字 
节 。 现 在 的 问题 是 BR 分 文 跳 转 到 0005， 这 是 第 一 个 分 区 中 进程 的 代码 地 址 。 不 仅 这 个 进程 
会 运行 错误 ， 还 有 可 能 破坏 其 他 进程 的 数据 。 操 作 系 统 需要 保护 进程 不 受 其 他 并 发 进程 的 未 
FEAL 

能 够 把 程序 加 载 到 内 存 中 任意 位 置 的 装载 器 称 为 可 重 定位 装载 器。8.1 节 中 讲述 的 Pep/8 2 
载 硕 不 是 可 重 定位 的 装载 占 ， 因 为 它 把 每 个 程序 都 加 载 到 内 存 的 同一 位 置 ， 也 就 是 0000 (hex), 

解决 这 个 问题 有 几 种 方法 。 操 作 系 统 可 以 要 求 汇编 语言 程序 员 决 定 把 程序 加 载 到 内 存 的 
什么 位 置 。 汇 编 器 需要 提供 一 个 指令 以 允许 程序 员 指 定 目标 代码 的 第 一 个 字 节 的 地 址 。 这 样 
的 指令 常见 的 名 字 是 .0RG6， 意 思 是 origin (起 点 )。 在 这 个 例子 中 ，32KB 分 区 的 起 始 地 址 
是 16K 或 者 说 8000 (hex)。 代 码 的 前 几 行 改 成 如 下 形式 : 

. ORG 0x8000 

8000 048005 BR AbsVal 

8003 0000 number: .BLOCK 2 

8005 318003 AbsVal: DECI number,d 
其 效果 就 是 把 应 用 程序 代码 中 的 所 有 内 存 引用 都 加 上 8000. | 

如 果 编 译 器 为 应 用 程序 生成 目标 代码 ， 那 么 程序 员 是 没有 内 存 地 址 概念 的 。 翻 译 器 需要 
和 操作 系统 合作 生成 正确 的 目标 代码 中 的 内 存 引用 。 


9.1.3 ”逻辑 地 址 
要 求 程 序 员 或 编译 般 事 先 指定 将 目标 代码 装载 到 哪里 有 几 个 缺点 。 应 用 程序 的 程序 员 不 


部 的 16 KB 
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需要 担心 分 区 的 大 小 和 人 位置， 这样 的 信息 与 程序 员 应 该 没有 关系 。 这 种 方案 背离 了 操作 系统 
要 为 高 级 编程 提供 方便 环境 的 目标 。 

它 还 背离 了 高 效 分 配 系统 资源 的 目标 。 假 设 程序 员 指 定 把 一 个 3KB 的 程序 加 载 到 第 二 
个 4KB 的 分 区 ,“ 它 从 地 址 4K 开始 ， 并且 相 应 地 设置 .ORG 指令 。 在 系统 运行 过 程 中 ， 即 使 
第 一 个 4KB 分 区 是 空闲 的 ， 该 作业 还 是 有 可 能 等 待 男 一 个 占用 第 二 个 4KB 分 区 的 作业 才能 
加 载 。 有 未 使 用 的 内 存 就 表示 资源 分 配 不 够 高 效 。 

要 解决 这 些 问 题 ， 操 作 系 统 需 支 持 程 序 员 或 编译 右 和 生成“ 好像” 会 被 加 载 到 地 址 0 的 目 
标 代 码 。 在 这 种 假设 下 生成 的 地 址 称 为 逻辑 地 址 (logical address)。 如 果 程 序 被 加 载 到 地 址 
不 是 0 的 分 区 中 ， 那 么 操作 系统 必须 把 逻辑 地 址 翻译 成 物理 地 址 (physical address). 

下 面 公式 描述 的 是 物理 地 址 、 逻 辑 地 址 和 程序 加 载 到 的 分 区 第 一 个 字 节 的 地 址 之 间 的 
关系 : 

物理 地 址 = 敢 辑 地 址 + 分 区 地 址 

在 前 面 代 码 段 的 例子 中 ，number 的 逻辑 地 址 是 0003 ， 而 物理 地 址 是 8003 。 

有 两 种 可 行 的 地 址 翻译 技术 。 操 作 系 统 可 以 提供 一 个 软件 工具 ， 把 分 区 地 址 加 到 目标 代 
码 中 的 所 有 内 存 引 用 上 。 翻 译 需 需要 指定 对 目标 代码 中 哪些 部 分 进行 调整 ， 因 为 只 通过 检查 
原始 目标 代码 ， 工 具 不 能 分 辩 哪 些 部 分 是 内 存 引用 。 

另 一 种 技术 依赖 于 特殊 的 硬件 ， 称 为 基 址 和 边界 寄存 器 。 基 址 寄存 器 (base register) 解 
决 了 地 址 翻译 的 问题 ， 边 界 寄存 器 (bound register) 解决 的 是 保护 的 问题 。 图 9-2 展示 了 对 
前 面 的 例子 来 说 ， 基 址 和 边界 寄存 顺 是 怎么 工作 的 。 


基 址 寄存 器 边界 寄存 器 


0003 8003 真 


物理 地 址 


8003 
合法 物理 地 址 









内 存 






假 
韭 法 地 址 中 断 
图 9-2 ”用 基 址 和 边界 寄存 器 把 逻辑 地 址 翻译 成 物理 地 址 


操作 系统 把 使 用 未 修改 逻辑 地 址 的 目标 程序 加 载 到 在 地 址 8000 的 分 区 中 ， 然 后 把 基 址 
寄存 器 加 载 为 值 8000， 边 界 寄存 器 加 载 为 值 A000 (hex) = 48 K, 这 是 该 程序 加 载 到 的 分 区 
的 上 界 。 操 作 系 统 把 程序 计数 器 设置 为 0000 一 一 第 一 条 指令 的 逻辑 地 址 ， 也 就 把 CPU 交 给 
了 该 进程 。 

每 当 CPU 发 出 一 条 内 存 读 请 求 ， 硬 件 就 把 基 址 寄存 器 的 内 容 加 到 CPU 提供 的 地 址 上 ， 
形成 物理 地 址 。CPU 会 把 物理 地 址 与 边界 寄存 器 的 内 容 进 行 比较 ， 如 果 物 理 地 址 小 于 边界 
寄存 器 ， 那 么 硬件 会 完成 该 内 存 访问 ; 否则 会 生成 非法 地 址 中 断 ， 操 作 系 统 必须 服务 该 中 
断 。 边 界 寄存 器 阻止 进程 侵入 其 他 进程 的 内 存 分 区 。 

这 个 例子 中 第 一 个 内 存 读 请 求 将 来 自 于 冯 : 诺 依 曼 执行 周期 中 的 取 指 令 部 分 。CPU 会 
请 求 从 0000 获取 一 条 指令 ， 硬件 会 翻译 成 从 8000 取 指 令 。 图 9-2 给 出 的 是 对 DECI 操作 数 
指示 符 的 逻辑 地 址 0003 的 翻译 。( 实 际 上 ， 在 较 低 的 抽象 层次 上 ， 它 是 DECI 陷阱 处 理 程 序 
中 在 FFOA 处 的 STA 指令 的 操作 数 。) 
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为 了 切换 到 另 一 个 进程 ， 操 作 系 统 把 基 址 寄存 器 设置 为 该 进程 加 载 到 的 分 区 的 地 址 ， 把 
边界 寄存 器 设置 为 第 二 个 分 区 的 地 址 。 当 操作 系统 从 PCB 恢复 出 CPU 寄存 器 (包括 程序 计 
Mat) 时 ， 进 程 会 从 它 被 挂 起 的 地 方 继续 执行 。 

考虑 当 操作 系统 必须 调度 作业 来 占用 固定 分 区 时 所 面临 的 问题 。 假 设 图 9-1 中 所 有 分 区 
都 被 占用 了 ， 除 了 32KB 的 分 区 。 如 果 有 一 个 4KB 的 作业 请 求 执 行 ， 系统 应 该 把 它 放 入 这 
个 32KB 的 分 区 中 ， 还 是 应 该 继续 等 待 更 小 的 可 用 分 区 ? 假设 把 作业 放 进 32KB 的 分 区 中 ， 
然后 有 一 个 4KB 的 进程 终止 。 如 果 此 时 有 一 个 32KB 的 作业 进入 系统 ， 系 统 就 不 能 加 载 它 
了 。 反 之 ， 如 果 不 把 小 作业 调度 到 大 分 区 中 会 更 好 一 些 ， 因 为 这 样 大 作业 就 能 在 它 一 请 求 执 
行 时 就 使 用 大 分 区 了 ， 而 小 作业 也 能 很 快 被 加 载 进 来 。 操 作 系 统 不 能 预测 进程 什么 时 候 结束 
或 者 什么 时 候 请 求 执行 ， 所 以 没有 办 法 实现 最 优 调度 。 

另 一 个 问题 是 操作 系统 一 开始 该 如 何 设 立 这 些 分 区 呢 ? 在 图 9-1 中 ， 如 果 有 一 个 16KB 
的 作业 和 一 个 32KB 的 作业 同时 请 求 执行 ， 那 么 系统 只 能 加 载 一 个 ， 即 使 实际 上 用 户 内 存 可 
用 空间 总 量 是 48KB。 男 一 方面 ， 如 果 操 作 系 统 把 用 户 空 间 划 分 为 两 个 大 的 分 区 ， 而 有 6 个 
或 8 个 4KB 的 作业 请 求 执行 ， 那 么 除了 两 个 作业 外 其 他 的 都 会 被 延迟 。 还 是 没有 办 法 实现 
最 优 分 区 ， 因 为 操作 系统 不 能 预测 未 来 。 


9.1.4 ”可 变 分 区 多 道 程序 设计 


为 了 解决 固定 分 区 调度 中 固有 的 低 效 率 ， 操 作 系 统 可 以 维护 边界 可 变 的 分 区 ， 方 法 是 只 
在 作业 加 载 进 内 存 时 才 设 立 分 区 。 分 区 的 大 小 可 以 正好 适合 作业 的 大 小 ， 这 样 作业 在 进入 系 
统 时 就 会 有 更 多 内 存 可 用 。 

当 作 业 停 止 执行 时 ， 它 占用 的 内 存 区 域 就 可 以 供 其 他 作业 使 用 了 。 可 供 新 到 来 的 作业 使 
用 的 内 存 区 域 称 为 洞 (hole)。 当 操作 系统 把 洞 分 配给 后 来 的 作业 时 ， 称 为 把 洞 填 上 了 。 与 固 
定 分 区 方案 一 样 ， 操 作 系 统 调度 作业 使 得 任意 时 刻 内 存 中 的 进程 数 最 大 。 

图 9-3 给 出 了 一 个 可 用 内 存 区 域 为 48KB 的 例子 ， 此 时 尚未 调度 任何 作业 。 图 9-4 是 一 
个 假想 的 、 对 图 9-3 所 示 用 户 内 存 进行 请 求 的 作业 序列 。 当 作业 停止 执行 时 ， 会 释放 它 的 内 
存 供 其 他 作业 使 用 。 

图 9-5 说 明了 调度 过 程 。 现 在 问题 是 必须 解决 选择 标准 的 问题 ， 也 就 是 当 新 作业 请 求 
内 存 时 先 填 哪个 洞 。 图 9-5 使 用 的 方法 称 为 最 优 适 配 算 法 (best-fit algorithm )。 在 所 有 大 
于 作业 要 求 内 存量 的 洞 中 ， 操 作 系 统 选择 最 小 的 那个 。 也 就 是 说 ， 系 统 选择 最 适合 该 作业 
的 洞 。 

当 J1 请 求 12 KB 时 ， 对 于 图 9-3 中 的 初始 洞 ， 只 有 一 个 洞 能 够 用 来 分 配 内 存 。 系 统 把 
最 开始 的 12KB 分 给 J1， 剩 下 一 个 36KB Wi, 4 J2 请 求 8KB 时 ， 系 统 把 洞 的 前 面 一 部 分 
分 配给 它 ， 对 于 3、J4 A JS 来 说 过 程 类 似 ， 得 到 图 9-5a 所 示 的 内 存 分 配 结果 。 

图 9-5b 展示 了 当 J1 停止 执行 时 的 分 配 状况 ， 此 时 会 清除 J1 的 12KB， 在 主 存 顶 部 生成 
了 一 个 新 的 洞 。 当 J6 请 求 一 个 4KB 的 区 域 时 ， 操 作 系 统 可 以 选择 将 两 个 洞 中 的 任意 一 个 分 
配给 它 。 根 据 最 优 适 配 算 法 ， 系 统 选择 8KB 而 不 是 12-KB 的 洞 ， 因 为 较 小 的 洞 适 配 得 更 
好 。 图 9-5c 给 出 了 结果 。 

图 9-5d Æ J5 停止 之 后 的 分 配 情况 ， 图 9-5e 是 系统 从 顶部 的 洞 给 J7 分 配 内 存 之 后 的 情 
况 。 现 在 有 三 个 小 的 洞 分 散在 整个 内 存 中 ， 这 种 现象 称 为 碎片 ( fragmentation)。 即 使 J8 想 
要 8KB， 可 用 内 存 的 总 量 是 12 KB J8 也 不 能 运行 ， 因 为 可 用 内 存 不 是 连续 的 。 
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图 9-3 初始 可 用 的 用 户 内 存 。 图 9-4 可 变 分 区 多 道 程序 设计 系统 的 作业 
地 址 的 单位 为 KB 请 求 序 列 。 作 业 大 小 的 单位 为 KB 











c) J6 开 始 d) JS 停止 e) J7 开 始 


图 9-5 ”最 优 适 配 算法 


当 出 现 由 于 碎片 内 存 而 不 能 满足 请 求 时 ， 操 作 系 统 只 能 等 待 足够 多 的 进程 完成 ， 才 能 有 
一 块 足够 大 的 内 存 可 用 。 在 这 个 例子 中 ， 该 请 求 很 小 ， 任 意 一 个 作业 完成 都 能 释放 足够 多 的 
内 存 让 J8 得 以 加 载 。 

在 很 拥挤 的 系统 中 运行 着 许多 小 作业 ， 如 果 有 一 个 大 作业 在 等 待 ， 那 么 该 请 求 可 能 要 等 
待 很 长 时 间 才 能 得 到 分 配 。 这 种 情况 下 ， 操 作 系 统 可 能 需要 花 点 儿 时 间 移 动 一 些 进程 ， 以 得 
到 一 个 足够 大 的 洞 来 满足 该 请 求 。 这 个 操作 称 为 合并 或 压缩 (compaction). 

图 9-6a 是 一 种 很 直观 的 合并 技术 。 操 作 系 统 把 进程 都 移动 到 内 存 上 部 ， 消 除 它 们 之 间 
的 所 有 洞 。 另 一 种 可 行 的 合并 方案 是 只 移动 必要 的 进程 ， 从 而 得 到 一 个 满足 请 求 的 、 足 够 大 
的 洞 。 在 图 9-6b 中 系统 只 移动 J6， 就 可 以 得 到 一 个 足够 加 载 J8 的 洞 了 。 

最 优 适 配 算法 的 思路 是 使 用 尽 可 能 小 的 洞 ， 把 大 的 洞 留 给 未 来 的 调度 ， 通 过 这 种 方式 
实现 碎片 最 小 化 。 另 一 种 调度 技术 看 上 去 可 能 不 那么 合理 ， 叫 作 有 最 先 适 配 算法 〈first-fit 


a) J1~J5 开 始 b) J1 停 止 
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algorithm ) 。 该 算法 不 是 寻找 最 小 的 可 能 的 洞 ， 而 是 从 主 存 顶 部 开始 搜索 ， 
请 求 的 第 一 个 洞开 始 分 配 内 存 。 图 9-7 就 是 最 先 适 配 
算法 对 图 9-4 中 请 求 序列 的 执行 轨迹 . 

9-7a 和 图 9-7b 5 Al 9-5 中 的 最 优 适 配 算法 一 
样 。 在 图 9-7c 中 ，J6 请 求 一 个 4KB 的 分 区 ， 最 先 适 配 
算法 不 会 从 内 存 底部 最 小 的 洞 来 分 配 ， 而 是 发 现 内 存 
顶部 的 洞 ， 并 从 它 分 配 空间 给 J6。 

图 9-7d PIS Aik, 图 9-7e F, 位 于 J6 和 2 之 
间 的 第 一 个 可 用 的 洞 就 能 满足 J7 的 8KB 请 求 。 当 
J8 请 求 8KB 时 ， 有 一 个 洞 可 用 ， 系 统 不 需要 合并 
内 存 。 

一 个 例子 并 不 能 说 明 最 先 适 配 比 最 优 适 配 好 。 实 
际 上 ， 你 可 以 设计 一 个 请 求 和 释放 序列 ， 使 得 使 用 最 
先 适 配 比 最 优 适 配 先 需要 合并 。 那 么 问题 就 是 “平均 
起 来 效果 是 什么 样 的 呢 ?” 实 际 结果 是 在 内 存 使 用 率 图 9-6 ERN 
上 ， 两 种 算法 中 没有 一 种 明显 优 于 另 一 种 。 

最 先 适 配 算法 效果 不 错 的 原因 在 于 存储 系统 总 是 从 内 存 顶 部 进行 分 配 ， 就 容易 在 主 存 底 
部 形成 较 大 的 洞 ， 如 图 9-7 所 示 。 





a) 把 所 有 作业 移 到 顶部 b) 只 移动 J6 





a) J1 ~ JS 开始 b) J1 停 止 c) J6 开 始 d) J5 停 止 e) J7 开 始 
图 9-7 最 先 适 配 算 法 


无 论 分 配 策略 如 何 ， 在 可 变 分 区 系统 中 ,碎片 是 不 可 避免 的 。 非 连续 的 洞 就 意味 着 资 
源 分 配 不 够 高 效 ， 虽 然 可 以 通过 合并 收回 那些 不 可 用 的 内 存 区 域 ， 但 这 仍然 是 一 个 很 耗 时 的 
过 程 。 


9.1.5 JA 


分 页 是 一 种 解决 碎片 问题 的 创造 性 方法 ， 它 不 是 把 几 个 小 的 洞 合 并 成 一 个 大 的 洞 供 程 序 
使 用 ， 而 是 把 程序 分 解 开 去 适 台 洞 。 程 序 不 再 是 连续 的 ， 而 是 分 开 分 散在 整个 主 存 中 。 

图 9-8 展示 的 是 一 个 分 页 系统 中 正在 执行 的 三 个 作业 。 将 每 个 作业 划分 成 页 ， 将 主 存 划 
分 成 帧 ( frame )， 帧 的 大 小 和 页 相同 。 该 图 给 出 了 一 个 64KB 内 存 的 前 12KB 空间 ， 帧 的 大 
小 为 1KB。 页 的 大 小 总 是 2 的 帘 ， 实 际 中 通常 是 512、1024 或 2048 字 节 。 
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帧 地 址 Wg 
(hex ) ( dec ) 
0000 0 
0400 1 
Jl 12 0800 2 
页 0 0C00 3 
页 1 页 1 1000 4 
m 1400 5 
1800 6 
1C00 7 
将 作业 分 为 1KB 大 小 的 页 on r 
2400 9 
2800 10 


将 内 存 分 为 IKB 大 小 的 帧 
图 9-8 分 页 系统 


作业 J3 的 代码 分 布 在 主 存 四 个 非 连续 的 帧 中 。 位 于 1800 的 帧 中 的 “J3，P0” 表 示 作 业 
IZ 的 页 0， 第 二 页 在 2C00， 第 三 页 和 第 四 页 分 别 在 0800 和 2000。 同 样 ， 作 业 1 和 J]2 以 类 
似 方 式 分 布 在 内 存 中 。 如 果 作 业 J4 到 达 ， 需 要 3 KB 内 存 ， 则 操作 系统 可 以 把 它 分 布 到 页 
0400、1000 和 1400。 系 统 不 需要 为 新 到 来 的 作业 而 合并 内 存 。 

和 前 面 多 道 程序 设计 内 存 管理 技术 一 样 ， 使 用 分 页 技术 的 应 用 程序 会 假设 使 用 逻辑 地 
址 。 操 作 系 统 必 须 在 执行 时 把 逻辑 地 址 转换 成 物理 地 址 。 

9-9 展示 的 是 图 9-8 所 示 分 页 系统 中 逻辑 地 址 和 物理 地 址 的 关系 。 因 为 页 的 大 小 
是 1KB， 也 就 是 2"， 所 以 逻辑 地 址 最 右边 的 10 位 是 距离 页 顶部 的 偏 移 量 ， 最 左边 6 位 是 


页 号 。 


页 号 偏 移 量 帧 号 偏 移 量 
at ae a ae 
一 6 位 —+>|<— 10 位 一 ~| < 6 位 —+>|<«— 10 位 一 一 | 

a) 逻辑 地 址 b) 物理 地 址 


图 9-9 分 页 系统 中 的 逻辑 地 址 和 物理 地 址 


例如 地 址 058F ， 二 进 制 表示 是 0000 0101 1000 1111。 最 左边 6 位 是 0000 01， 表 示 该 地 
址 对 应 的 内 存 位 置 在 页 号 1 内 ; 因为 01 1000 1111 是 399 (dec)， 所 以 该 逻辑 地 址 表示 距离 
页 号 1 内 第 一 个 字 节 399 个 字 节 的 位 置 。 

参考 图 9-8， 这 个 字 节 的 物理 地 址 是 距离 地 址 为 2C00 的 帧 中 第 一 个 字 节 399 字 节 的 位 
置 。 要 把 逻辑 地 址 翻译 为 物理 地 址 ， 操 作 系统 必须 把 6 位 页 号 0000 01 替换 成 6 位 帧 号 0010 11, 
偏 移 量 保留 不 变 。 

在 前 面 的 内 存 管 理 方案 中 ， 一 个 基 址 寄存 器 足以 把 逻辑 地 址 翻译 成 物理 地 址 。 而 分 页 
需要 一 组 帧 号 ， 作 业 的 每 一 页 都 对 应 一 个 帧 号 。 这 样 的 帧 号 集合 称 为 页 表 (page table). 
图 9-10 给 出 的 是 图 9-8 中 作业 J3 关联 的 页 表 。 页 表 中 的 每 个 表 项 都 是 用 以 替换 逻辑 地 址 中 
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页 号 的 帧 号 。 


帧 地 址 帧 号 
(hex ) (dec ) 
逻辑 地 址 0 


058F 


CPU 0000 01 01 1000 1111 


一 OO WAN Auv A LUN = 


— jt 





一 一 一 一 一 一 
Wi- (bin ) 
图 9-10 将 带 页 表 的 逻辑 地 址 翻译 成 物理 地 址 
假设 作业 J3 执行 如 下 语句 


LDBYTEA 0x058F ,d 
它 会 使 CPU 请 求 从 逻辑 地 址 058F 读 内 存 。 操 作 系 统 抽出 前 6 位 0000 01， 然 后 把 它们 作为 
页 表 地 址 ， 一 个 特殊 的 硬件 内 存 存储 着 该 作业 的 帧 号 。 从 页 表 中 读 出 的 帧 号 替换 逻辑 地 址 中 
的 页 号 ， 得 到 物理 地 址 。 

CPU 发 出 的 指令 是 读 取 地 址 058F 的 内 容 ， 实 际 上 是 从 物理 地 址 2D8F 读 出 了 一 个 字 
节 。 程 序 以 为 它 自己 被 加 载 到 一 片 从 地 址 0000 开始 的 、 连 续 的 内 存 区域 ， 操 作 系 统 通过 为 
每 个 被 加 载 进 内 存 的 作业 提供 一 个 页 表 来 维护 这 种 假象 。 这 完 完 全 全 是 个 “骗局 ”， 实 际 上 
进程 在 时 间 上 不 断 中 断 ， 在 空间 上 也 是 分 散 的 ， 根 本 不 知道 自己 被 “欺骗 ”了 。 

分 页 也 没有 消除 碎片 ， 意 识 到 这 一 点 非常 重要 。 作 业 的 大 小 很 少 能 刚好 是 页 大 小 的 整数 
倍 ， 这 样 一 来 最 后 一 页 中 就 会 有 一 些 内 存 未 被 使 用 ， 图 9-11 展示 的 是 作业 J3 的 情况 。 作 业 
最 后 一 页 中 未 被 使 用 的 内 存 称 为 内 部 碎片 (internal fragmentation)， 区 别 = 
于 可 变 分 区 策略 中 操作 系统 可 见 的 外 部 碎片 。 P] 

页 的 大 小 越 小 ， 平 均 来 说 内 部 碎片 就 越 少 。 不 幸 的 是 ， 这 也 是 需要 Le 
权衡 折 中 的 。 页 的 大 小 越 小 ， 对 给 定 大 小 的 主 存 ， 帧 数 就 越 多 ， 因 此 页 表 | 
就 越 长 。 因 为 每 次 内 存 引用 都 要 访问 页 表 ， 页 表 通 常设 计 成 尽 可 能 快 的 电 “| 
路 ， 这 是 很 昂贵 的 ， 所 以 页 表 必 须 保 持 较 小 以 降低 成 本 。 


92 虚拟 内 存 


看 上 去 好 像 已 经 很 难 再 改进 分 页 系统 的 内 存 利 用 率 了 ,但 是 实际 上 人 们 又 把 分 页 的 概念 
进一步 提升 了 。 考 虑 一 个 大 型 程序 的 结构 ， 比 如 说 可 能 会 装 满 50 页 。 要 执行 这 个 程序 ， 真 
的 有 必要 把 SO 页 同时 全 部 装 进 主 存 吗 ? 


9.2.1 大 程序 的 行为 


大 多 数 大 程序 都 是 由 几 十 个 过 程 组 成 的 ， 其 中 有 些 可 能 根本 不 会 执行 。 例 如 负责 处 理 输 
和 人 错误 情况 的 过 程 ， 如 果 输 入 没有 错误 ， 它 就 不 会 被 执行 。 再 如 初始 化 数据 等 其 他 过 程 ， 可 





图 9-11 内 部 碎片 
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能 只 执行 一 次 ， 在 剩 下 的 时 间 里 都 不 再 需要 执行 。 

大 程序 中 和 常见 的 控制 结构 是 循环 。 当 循环 体 反复 执行 时 ， 只 有 循环 内 的 代码 需要 驻 留 在 “|457| 
内 存 中 ， 循 环 外 部 〈 从 执行 的 角度 看 ) 距离 很 远 的 代码 不 需要 放 在 内 存 中 。 

程序 可 能 还 包括 很 大 的 从 未 访问 的 数据 区 域 。 例 如 ， 如 果 在 C++ 中 声明 了 一 个 结构 数 
组 ， 但 是 不 知道 程序 执行 时 会 遇 到 多 少 个 这 样 的 结构 ， 可 能 就 会 分 配 比 预计 多 一 些 的 个 数 。 
包含 这 些 不 会 被 访问 的 结构 的 页 就 不 需要 加 载 。 

对 典型 大 程序 的 分 析 表 明 ， 只 把 程序 中 活跃 的 页 加 载 进 内 存 是 可 行 的 。 活 路 的 页 包含 反 
复 执行 的 代码 和 反复 访问 的 数据 。 

活跃 页 的 集合 称 为 工作 集 (working set)。 随 着 程序 的 进展 ， 工 作 集 中 会 加 入 新 的 页 ， 
也 会 有 旧 的 页 退出 。 例 如 ， 在 执行 开始 的 时 候 ， 包 含 初始 化 过 程 的 页 就 在 工作 集中 ， 随 后 工 
作 集 会 包括 处 理 过 程 的 页 ， 而 不 含有 初始 化 过 程 的 页 。 


9.2.2 虚拟 内 存 


记 住 ， 在 较 高 抽象 层次 上 的 程序 员 以 为 程序 是 在 逻辑 地 址 从 0 开始 且 连 续 的 内 存 中 执行 
的 。 假 设 系统 每 次 只 从 正在 执行 的 作业 加 载 几 个 页 ， 但 同时 仍然 保持 这 个 假象 ， 程 序 员 就 可 
能 编写 根本 不 能 一 次 性 装 入 主 存 的 超大 程序 ， 但 是 这 样 的 程序 仍然 能 够 执行 。 用 户 看 到 的 不 
是 已 经 安装 好 的 有 限 的 内 存 ， 而 是 一 个 虚拟 内 存 ， 只 受到 虚拟 地 址 的 限制 。 

例如 ， 在 较 老 的 Pep /7 计算 机 中 ， 地 址 是 16 位 的 ， 因 此 理论 上 可 以 访问 2* 字 节 
(64KB) 的 内 存 。 不 过 实际 上 只 安装 了 32KB 内 存 。 应 用 程序 从 0000 开始 ， 不 能 装 超 过 
31 000 (dec) 字 节 ， 否 则 就 落 入 操作 系统 的 内 存 区 域 了 。 系 统 安 装 少 于 地 址 位 数 允 许 的 内 存 
是 很 常见 的 ， 之 后 用 户 可 以 购买 更 多 的 内 存 来 升级 系统 。 

假设 Pep /7 计算 机 安装 了 一 个 支持 虚拟 内 存 的 操作 系统 。 程 序 的 物理 内 存 被 限制 为 
3000 字 节 ， 但 是 程序 员 还 是 想 执行 64KB 的 程序 。 操 作 系 统 把 执行 程序 所 需 的 页 面 从 磁盘 
加 载 到 内 存 帧 。 当 一 个 页 含有 要 执行 的 语句 或 要 访问 的 数据 时 ， 就 需要 加 载 它 ， 操 作 系 统 会 
去 除 一 个 不 再 活跃 的 页 ， 替 换 为 需要 加 载 的 页 。 程 序 员 看 到 程序 在 一 个 64KB 的 虚拟 地 址 空 








间 中 执行 ， 实 际 上 物理 地 址 空间 只 有 32KB。 458| 
图 9-12 展示 了 如 何 扩展 分 页 系统 以 实现 虚拟 内 存 系统 。 系 统 中 有 3 个 作业 ,JI 有 10 页 ， 
页 表 主 存 
Jl J2 
帧 号 “加载 位 帧 号 ”加载 位 
cg ae a 
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图 9-12 虚拟 内 存 的 一 种 实现 
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J2 有 2 页 , J3 有 4 页 。 注 意 ， 物 理 内 存 只 包含 8 帧 ， 但 是 即使 Ji 大 于 物理 内 存 ， 页 仍然 可 
以 执行 。 操 作 系统 需要 一 个 特殊 的 人 硬件， 为 每 个 作业 保存 一 张 页 表 ， 还 有 一 张 帧 表 ， 每 个 表 
项 对 应 一 个 帧 。 为 了 说 明 简 单 ， 帧 号 用 十 进 制 给 出 。 

页 表 把 逻辑 地 址 翻译 成 物理 地 址 ， 如 图 9-10 所 示 。 不 过 在 虚拟 内 存 系 统 中 ， 虽 然 作业 
在 运行 ， 但 是 它 的 有 些 页 并 没有 加 载 到 内 存 中 。 页 表 中 每 个 页 都 有 额外 的 一 位 告诉 操作 系统 
该 页 是 否 已 加 载 。 如 果 页 已 经 加 载 到 内 存 中 了 ， 则 该 位 为 1， 否 则 为 0。 图 9-12 用 YY 表示 
1， 是 yes 的 意思 , 用 N 表示 0， 即 no。 

帧 表 是 为 了 帮助 操作 系统 为 各 个 作业 从 内 存 中 分 配 帧 。 第 一 项 表示 分 配给 该 帧 的 作业 ， 

二 项 这 1 位 称 为 脏 位 (dirty bit)， 它 的 功能 稍 后 解释 。 


Ken Thompson 和 Dennis M. Ritchie 

Ken Thompson 1943 年 生 于 新 奥尔良 。 他 1966 年 从 加 州 大 学 伯克利 分 校 电 子 工程 专 
业 硕士 毕业 ， 加 入 贝尔 实验 室 计 算 研 究 组 。Dennis Ritchie 1941 年 生 于 纽约 州 Bronxville, 
1968 年 从 哈佛 获得 数学 博士 学 位 ， 在 Thompson 之 后 一 年 加 入 贝尔 实验 室 。 当 时 贝尔 
实验 室 在 与 MIT 和 通用 电气 就 Fernando Corbaté 领导 的 Multics 项目 展开 合作 ， 不 过 在 
1969 年 退出 了 该 项 目 ， 因 为 他 们 认为 Multics 野心 太 大 ， 不 可 能 交付 一 个 可 用 的 产品 。 

贝尔 实验 室 的 研究 者 不 想 放 弃 Multics 分 时 系统 的 优点 ， 继 续 努 力 研发 新 的 可 以 满足 
他 们 需求 的 操作 系统 。 他 们 将 系统 命名 为 UNIX， 和 Multics 谐音 ， 所 以 UNIX 不 是 一 个 
首 字 母 缩 写 词 。 

贝尔 实验 室 研究 组 的 应 用 原型 是 Thompson 在 Multics 系统 上 写 的 游戏 ， 名 为 “星际 
旅行 ”， 模 拟 太 阳 系 中 行星 的 运动 以 及 用 户 引 寻 的 一 稻 火 箭 飞 船 。Thompson 和 Ritchie 将 
该 游戏 移植 到 PDP-7 计算 机 上 ， 第 一 个 UNIX 文件 系统 就 是 在 PDP-7 上 实现 的 。 

UNIX 最 初 的 版 本 是 用 汇编 语言 编写 的 ， 这 是 个 枯燥 兄长 的 过 程 。Thompson 和 
Ritchie 不 喜欢 Multics 使 用 的 PLI 语言， 因为 对 于 他 们 在 贝尔 实验 室 使 用 的 小 型 计算 机 
来 说 ， 该 语言 太 庞 大 了 。BCPL 语言 曾 用 在 MIT CTSS 系统 上 ， 但 是 有 些 不 好 的 特性 。 所 
以 Thompson 在 BCPL 的 基础 上 创造 了 B 语言 ， 使 它 能 够 在 PDP-7 上 运行 。 

1971 $, Thompson 把 UNIX 从 PDP-7 移植 到 PDP-11。 把 UNIX 移植 到 新 机 型 上 显 
示 出 可 移植 性 的 重要 ， 以 及 B 语言 的 特有 缺陷 。1972 年 ，Ritchie 创造 了 C 语言 ， 它 的 表 
达 目 标 是 用 HOL6 层 语 言 实现 UNIX 操作 系统 ， 因 此 可 以 很 容易 地 把 UNIX 移植 到 不 同 
机 型 上 。1973 年 ，Thompson 用 Ritchie 的 C 语言 重 写 了 UNIX. 

在 20 世纪 70 年 代 中 期 ，UNIX 广泛 应 用 于 全 
世界 的 学 术科 研 机 构 。UC Berkeley 创造 的 UNIX 
的 Berkeley Systems Distribution (BSD) 对 因 特 
网 的 开发 很 有 帮助 。1987 年 Andy Tanenbaum 从 
零 开 始 完成 了 UNIX 的 一 个 实现 ， 称 为 Minix， 

用 于 他 的 操作 系统 教材 。1991 年 芬兰 的 一 个 使 
用 他 的 书 的 学 生 Linus Torvalds 使 用 Minix 
的 思想 写 出 了 他 自己 版 本 的 UNIX， 称 为 Linux。 
甚至 苹果 公司 也 转向 UNIX 的 BSD 版 本 ， 基 于 
它 开发 出 了 自己 的 最 新 操作 系统 ， 称 为 OS X。 Alcatel-Lucent 版 权 所 有 ， 经 授权 许可 使 用 
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由 于 他 们 对 通用 操作 系统 理论 的 贡献 ， 特 别 是 实现 了 UNIX 操作 系统 ，Ken 
_ Thompson 和 Dennis M. Ritchie 在 1983 年 获得 图 灵 奖 
“UNIX 基本 上 用 个 简单 的 操作 系统 ， 但 是 你 得 是 个 天 才 才 能 理解 它 的 简单 ” 


| —Dennis Ritchie 
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图 9-12 说 明 作 业 J1 和 J3 并 没有 把 所 有 页 都 加 载 进 主 存 。 假 设 J3 在 执行 页 P1 中 的 代 
码 ，P1 被 加 载 进 帧 0， 接 下 来 就 要 执行 一 条 LDA 指令 ， 它 的 操作 数 在 P2 中 。 操 作 系 统 怎 
么 知道 J3 需要 把 P2 加 载 进 内 存 呢 ? 因为 操作 系统 不 能 预测 未 来 ， 只 有 了 J 实际 执行 到 LDA 
语句 时 ， 它 才能 知道 这 一 点 。 

在 把 逻辑 地 址 翻译 为 物理 地 址 的 过 程 中 ， 硬 件 要 访问 J3 的 页 表 ， 以 确定 物理 地 址 的 帧 
号 。 因 为 加 载 位 为 N， 所 以 发 生 一 个 称 为 缺 页 (page fault) 的 中 断 。 操 作 系统 会 干预 并 服务 
该 中 断 。 

当 和 缺 页 发 生 时 ， 操 作 系 统 搜 索 帧 表 ， 确 定 系 统 中 是 和 否 还 有 空 的 帧 。 图 9-12 显示 帧 7 是 
可 用 的 ， 所 以 操作 系统 可 以 把 P2 加 载 到 该 帧 中 ， 再 更 新 帧 表 ， 记 录 帧 7 包含 J3 的 页 ， 也 更 
新 J3 的 页 表 ， 将 P2 记录 在 帧 7 中 ， 并 把 加 载 位 设置 为 Y。 

当 操 作 系统 从 中 断 返 回 时 ， 它 会 把 程序 计数 需 设 置 为 导致 缺 页 的 指令 地 址 ， 即 重新 执行 
该 指令 。 这 次 ， 当 硬件 访问 J3 的 页 表 时 ， 不 会 再 发 生 中 断 ST, LDA 指令 的 操作 数 会 被 放 人 
累加 器 中 。 

那么 ， 什 么 时 候 操作 系统 要 把 一 页 加 载 进 主 存 ? 答案 很 简单 ， 就 是 当 程序 需要 它 的 时 
候 。 在 前 面 的 例子 中 ，J3 通过 缺 页 中 断 机 制 请 求 加 载 P2。 分 页 机 制 和 按 需 取 页 的 区 别 在 于 
按 需 取 页 只 在 有 需求 的 时 候 才 把 页 载 人 内 存 ， 如 果 从 来 不 需要 某 个 页 ， 那 么 就 永远 也 不 会 装 
AC- 


9.2.4 替换 页 


当 J3 需要 P3 被 加 载 时 ， 操 作 系 统 没 有 问题 ， 因 为 主 存 中 还 有 空 的 帧 。 不 过 假设 作业 请 
求 页 的 时 候 ， 所 有 帧 都 被 十 满 了 ， 这 时 ， 操 作 系 统 必 须 选 择 一 个 已 经 加 载 进来 的 页 ， 把 它 替 
换 出 去 ， 释 放 它 的 帧 给 新 请 求 的 页 。 

被 蔡 换 的 页 之 后 可 能 还 会 加 载 ， 并 可 能 加 载 到 不 同 帧 中 。 要 保证 再 次 加 载 的 状态 和 替换 
前 的 状态 相同 ， 操 作 系 统 可 能 需要 保存 页 的 状态 ， 在 页 被 蔡 换 时 把 它 写 回 磁盘 。 在 有 些 情 况 
下 ， 也 可 能 在 被 替换 时 不 必 把 页 写 回 磁盘 。 

图 9-12 F, JI 有 10 页 存储 在 磁盘 上 ， 其 中 3 页 已 经 加 载 进 了 主 存 。 当 JI 执行 LDA 和 
ASLA 这 样 的 指令 时 ， 不 会 修改 主 存 中 页 的 状态 。LDA 引发 一 个 内 存 读 ， 并 把 操作 数 放 进 累 
MMi o ASLA 会 改变 累加 帮 的 值 ， 该 动作 不 涉及 内 存 读 或 内 存 写 。 这 两 条 指令 都 不 会 引起 
内 存 写 。 

但 是 当 J1 执行 像 STA 这 样 的 指令 时 ， 会 改变 主 存 中 页 的 状态 。STA 把 累加 器 的 内 容 放 
在 操作 数 的 位 置 上 ， 在 进程 中 进行 内 存 写 。 如 果 操 作 数 在 帧 4 的 P0 中 ，P0 在 主 存 中 的 状态 
就 会 改变 。 磁 盘 上 的 PO 页 和 主 存 中 当前 的 PO 就 不 完全 一 致 了 。 如 果 没 有 执行 过 存储 指令 ， 
那么 该 页 在 磁盘 上 的 映像 和 主 存 中 该 页 的 副本 会 完全 一 样 。 
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在 缺 页 发 生 时 ， 操 作 系 统 会 选择 一 个 页 进行 替换 ， 如 果 磁 盘 上 的 映像 仍然 是 内 存 中 该 页 
的 一 个 副本 ， 那 么 就 不 需要 把 该 页 写 回 磁盘 。 为 了 帮助 操作 系统 决定 是 否 需 要 写 回 ， 帧 表 的 
硬件 中 包含 了 一 个 特殊 位 一 一 脏 位 。 

当 页 被 初次 加 载 到 空 帧 中 时 ， 操 作 系统 把 脏 位 设置 为 0， 在 图 9-12 中 用 N 表示 。 如 果 
有 存储 指令 引起 写 内 存 ， 硬 件 会 把 该 帧 的 脏 位 置 为 1， 在 图 中 用 YY 表示。 称 这 样 的 页 为 脏 
页 ， 是 因为 它 已 经 不 再 处 于 原始 的 干净 状态 。 如 果 选 择 替 换 某 个 页 ， 操 作 系 统 会 检查 脏 位 ， 
决定 是 否 必 须 在 用 新 页 覆盖 该 帧 之 前 把 该 页 写 回 磁盘 。 


925 页 替换 算法 


在 按 需 分 页 系统 中 ， 操 作 系 统 有 两 项 内 存 管理 任务 : 给 作业 分 配 帧 ， 以 及 当 发 生 缺 页 且 
所 有 帧 都 满 了 时 ， 选 择 蔡 换 的 页 。 

一 种 合理 的 帧 分 配 策略 是 假设 大 作业 需要 比 小 作业 更 多 的 帧 ， 系 统 可 以 按 比 例 分 配 帧 。 
如 果 JI 是 J2 的 两 倍 ， 则 执行 时 需要 的 帧 就 应 该 是 J2 的 两 倍 。 

假设 作业 执行 时 的 帧 数 是 固定 的 ， 操 作 系 统 怎么 决定 缺 页 发 生 且 该 作业 的 所 有 帧 都 满 了 
时 ， 该 替换 哪个 页 呢 ?” 两 种 可 行 的 页 蔡 换 算法 是 先进 先 出 ( First In, First Out, FIFO) 和 最 
少 被 使 用 (Least-Recently Used, LRU). 

图 9-13 展示 的 是 FIFO 页 替换 算法 的 行为 ， 在 这 个 系统 中 一 个 作业 被 分 配 了 三 个 帧 。 当 
作业 执行 时 ，CPU 向 主 存 发 送 连续 的 读 写 请 求 流 。 每 个 地 址 的 第 一 组 位 是 页 号 ， 如 图 9-9 
和 9-10 所 示 。 页 引用 执行 作业 所 产生 的 页 号 序列 。 


6 8 3 8 6 0 3 6 3 5 3 6 页 引用 
6} {8} 13| {3} [3] 10) lol [6] [6] 15] [3] 13 
一 | {6} ie] el {8} [3] [3] [ol jo} [6] |5] |5] 己 加 载 页 
一 | LE} Le} Le} Le} Ls} Le} La L Lo} Le} Le 
F F F F F F F 缺 页 
图 9-13 ”使 用 三 个 帧 的 FIFO 页 替换 算法 


图 9-13 表明 在 第 一 个 请 求 发 生前 有 三 个 空 页 可 用 。 作 业 请 求 P6 时 发 生 缺 页 ， 在 图 中 用 
F 表示 ， 然 后 P6 被 加 载 进 一 个 帧 中 。 

当 作 业 请 求 P8 时 又 发 生 缺 页 ,P8 被 加 载 到 一 个 空 帧 中 。 图 中 的 方 框 不 表示 某 个 特 指 的 帧 ， 
可 见 P6 回 下 移动 了 一 个 方 框 以 放 和 人 P8， 在 实际 计算 机 中 ，P6 是 不 会 移动 到 另 一 个 帧 中 的 。 

对 P3 的 引用 会 再 次 引发 缺 页 ， 但 是 接 下 来 对 P8 的 引用 就 不 会 了 ， 因 为 P8 仍然 在 加 载 
页 集合 中 。 类 似 地 ， 对 P6 的 引用 也 不 会 产生 缺 页 。 

对 PO 的 引用 会 导致 缺 页 中 断 ， 啊 应 该 中 断 必 须要 选择 一 个 替换 页 。FIFO 算法 会 替换 最 
先 加 载 的 页 。 因 为 图 中 把 已 有 的 页 往 下 移 ， 然 后 放 人 新 的 页 ， 所 以 最 先 加 载 的 页 在 底部 ， 即 
P6。 操 作 系 统 会 用 PO 替换 P6. 

当 作 业 有 三 个 帧 时 ， 给 定 的 12 个 页 引用 引发 了 7 次 缺 页 。 如 果 作 业 有 更 多 的 帧 ， 页 引 
用 序列 应 该 会 产生 更 少 的 缺 页 。 图 9-14 给 出 的 是 FIFO 算法 对 同一 个 页 引用 序列 但 是 有 四 个 
帧 的 执行 情况 。 如 预期 的 那样 ， 这 个 序列 产生 的 缺 页 次 数 较 少 。 

通常 来 说 ， 如 果 帧 数 增加 ， 缺 页 次 数 会 减少 ， 如 图 9-15a 所 示 ， 像 前 面 两 个 例子 说 明 的 
那样 。 不 过 在 按 需 分 页 系统 发 展 的 早期 ， 人 们 发 现 了 一 个 很 奇怪 的 现象 ， 对 于 一 个 给 定 的 页 
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引用 序列 ，FIFO 页 蔡 换 算法 实际 上 可 能 在 使 用 更 多 帧 的 情况 下 ， 却 产生 更 多 的 缺 页 。 


6 8 js 8 6 0 3 6 #3 5 
一 | {6} 1 13} 13) 13) Lo} fo} fo} bo 
=| {=| fe} Le} Ley fs] pa} pa) pa] [3 
=| {=| |=} [6] Le} Le} fs] fs} fe] [sl 
te) def tet ey te) PS) ey bs) re! 

F F F F 


图 9-14 使 用 4 AY FIFO 页 替换 算法 
具有 这 样 属性 的 页 引用 序列 是 
aa r E E E A a y e 


图 9-15b 是 该 序列 帧 数 与 缺 页 次 数 的 关系 图 ， 结 果 显 示 4 个 帧 的 缺 页 数 比 3 个 帧 更 多 。 这 种 
现象 称 为 Belady 异常 (Belady'”s anomaly)， 是 根据 发 现 者 L.A. Belady 的 名 字 命 名 的 。 


页 引用 





异常 
12 
10 | 
Pi Bia 
长 K 8 
E E 
Rc) K 6 
4 
2 
Wig i 3s 4 8 6 
帧 数 
a) 使 用 更 多 的 帧 对 缺 页 次 数 的 预期 效果 b) FIFO 蔡 换算 法 中 的 Belady 异 常 . 


图 9-15 ” 帧 数 对 缺 页 次 数 的 影响 


FIFO 算法 选择 在 帧 集合 里 存在 时 间 最 长 的 页 ， 这 看 上 去 是 个 合理 的 标准 。 当 作业 执行 
时 ,会 进入 新 的 代码 和 数据 区 域 , 来 自 旧 区 域 的 页 就 不 再 需要 了 ， 所 以 会 替换 最 老 的 页 。 

但 是 再 仔细 想 想 ， 考 虑 页 最 近 一 次 被 引用 距离 当前 的 时 间 比 考虑 页 已 经 在 帧 集合 里 的 时 间 
可 能 更 好 一 些 。LRU 背后 的 思想 是 ， 最 近 引 用 的 页 比 未 引用 的 页 更 可 能 在 不 远 的 将 来 被 引用 。 

图 9-16 说 明 的 是 对 图 9-13 中 同样 的 页 引用 序列 ，LRU 页 替换 算法 是 怎样 工作 的 。 请 求 
P6、P8 和 P3 会 得 到 同 FIFO 算法 一 样 的 状态 。 接 下 来 请 求 P8 会 把 该 页 带 到 顶部 的 方 框 里 ， 
表明 PS 现在 是 最 近 使 用 过 的 。 后 续 的 请 求 P6 会 把 Po 带 到 顶部 ， 把 P8 和 了 P3 往 下 移 。 图 中 
的 方 框 按照 前 面 的 使 用 顺序 排序 ， 最 远 被 使 用 的 页 在 底部 。 


6 8 3 8 6 0 3 6 3 5 3 6 页 引用 
6} 18 {3} [8] {6} lo] [3] Le] [3] 01131116. 
一 | {6} {8} [3] [s] fe] lo] [3] [6] [3] [5s] [3] aman 
一 | [一 | Le} Le} L3] Le} Le} Lo} Lo} Le} Le} Ls 
F F F F F F 缺 页 
图 9-16 使 用 三 个 帧 的 LRU 页 替换 算法 
对 于 这 个 序列 ，LRU 算法 产生 的 缺 页 比 FIFO 算法 少 一 个 ， 不 过 一 个 例子 并 不 能 说 明 
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LRU fi F FIFO， 因 为 也 有 可 能 构造 出 一 个 序列 ， 使 FIFO 产生 的 缺 页 次 数 比 LRU D. 

实际 中 ， 操 作 系 统 根据 具体 机 器 可 用 的 硬件 特性 会 有 独特 的 页 替换 算法 。 最 凋 见 的 页 蔡 
换算 法 类 似 于 LRU， 对 于 真实 作业 的 页 请 求 序 列 ，LRU 的 效果 通常 比 FIFO 更 好 。 从 理论 
上 看 LRU 更 好 一 些 的 一 个 证 明 就 是 Belady 异常 不 会 发 生 在 LRU 替换 中 。 

前 面 例子 中 的 页 引用 序列 只 说 明了 页 蔡 换 算法 ， 这 并 不 实际 。 对 于 一 个 按 需 分 矶 的 系 
统 ， 要 想 高 效 ， 缺 页 率 必须 保持 在 每 100 000 次 内 存 引 用 中 会 有 大 约 一 次 缺 页 。 

一 个 设计 合理 的 、 基 于 按 需 分 页 的 虚拟 内 存 系统 能 够 满足 操作 系统 的 两 个 目标 。 它 为 高 
级 编程 提供 了 方便 的 环境 ， 因 为 程序 员 编 写 代 码 时 不 需要 受到 物理 内 存 的 限制 。 另 一 方面 ， 
它 能 高 效 地 分 配 内 存 ， 因 为 只 有 在 需要 的 时 候 ， 作 业 的 页 才 会 加 载 进 内 人 存 。 


93 文件 管理 


操作 系统 还 要 负责 维护 磁盘 上 的 文件 。 文 件 是 一 种 抽象 数据 类 型 ( ADT)。 对 于 系统 的 用 户 
来 说 ,文件 包含 数据 序列 ， 可 以 由 程序 或 者 操作 系统 命令 进行 管理 。 对 文件 常用 的 操作 包括 : 

o 创建 新 文件 

o 删除 文件 

o 重 命名 文件 

© 打开 文件 进行 读 

e 从 文件 读 出 下 一 块 数据 
操作 系统 要 连接 起 HOL6 层 或 Asmb5 层 程序 员 看 到 的 文件 的 逻辑 组 织 和 文件 在 磁盘 上 的 物 
理 组 织 。 


9.3.1 磁盘 驱动 器 


图 9-17 展示 的 是 磁盘 驱动 硕 的 物理 特性 。 图 9-17a i PH RE AEIR Z) Ar i H JLA A i A A 
记录 物质 的 盘 片 组 成 的 ， 盘 片 附着 在 中 央 转 轴 上 ， 转 轴 通 常 以 每 分 钟 5 400 转 的 速度 旋转 。 
徘 近 每 个 磁盘 表面 的 地 方 有 一 个 读 / 写 头 ， 它 连接 到 一 个 机 械 民 ， 机 械 臂 可 以 在 盘 片 表面 沿 
着 半径 方 癌 移动 恋 / BK 





a) 硬盘 驱动 器 b) 一 个 单独 的 磁盘 
图 9-17 磁盘 驱动 带 的 物理 特性 
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图 9-17b 给 出 的 是 一 个 单独 的 磁盘 。 如 果 机 械 臂 固定 在 一 个 位 置 ， 那 么 当 磁盘 旋转 时 ， 
读 / 写 头 下 面 扫 过 的 区 域 形 成 一 个 环 。 每 个 环 是 一 个 磁道 ， 它 存储 着 位 序列 。 磁 道 又 划分 成 
馅 饼 (pie) 形状 的 扇 区 。 块 是 一 个 盘 片 表面 的 一 个 磁道 的 一 个 忆 区 。 柱 面 是 机 械 臂 位 置 固定 
pen 所 有 盘 片 表面 上 对 应 磁道 的 集合 。 块 地 址 包括 三 个 组 成 部 分 一 一 柱 面 号 、 盘 
片 表 面 号 和 局 区 号 。 

软盘 类 似 于 硬盘 ， 除 了 它 的 盘 片 是 软 的 以 外 。 在 软盘 驱动 器 中 ， 读 / 写 头 物理 上 是 接触 
磁盘 表面 的 ， 而 在 硬盘 驱动 希 中 ， 读 / 写 头 是 浮 在 表面 之 上 的 ， 中 间 有 一 小 层 空气 垫 。 便 盘 
中 的 磁头 碰撞 (head crash) 是 机 械 故 障 ， 磁 头 探 到 了 盘 户 表面 ， 人 破坏 记录 物质 。 

从 给 定 的 块 读 出 信息 的 过 程 分 为 四 步 : 1 ) 机 械 臂 把 读 / 写 头 移动 到 指定 柱 面 ; 2) 电子 
电路 选择 指定 盘 片 表面 对 应 的 读 / 写 头 ; 3 ) 等 待 一 段 时 间 ， 等 指定 块 移动 到 该 / 写 头 下 ; 
4) 读 一 个 块 必须 要 求 整 个 块 经 过 读 / 写 头 。 第 2 ) 步 是 一 个 电子 功能 ， 相 比 起 其 他 3 个 步 
又 ， 发 生 的 时 间 可 以 忽略 不 计 。 

与 3 个 机 械 步 又 相对 应 的 时 间 分 别 是 : 

e 寻 道 时 间 

o HEIR 

o 传输 时 间 
寻 道 时 间 (seek time) 是 机 械 臂 移动 到 指定 柱 面 花费 的 时 间 ， 和 延迟 (latency) 是 读 / 写 头 到 位 
之 后 块 到 达 读 / 写 头 的 时 间 ; 而 传输 时 间 (transmission time) BRATZ / 写 头 的 时 间 。 访 
问 一 个 块 所 需 的 时 间 是 这 三 段 时 间 之 和 。 


93.2 文件 抽象 


在 较 高 抽象 层次 上 的 用 户 不 需要 担心 物理 磁道 和 遍 区 。 操 作 系 统 要 隐藏 物理 组 织 的 细 
只 向 用 户 展示 文件 的 逻辑 组 织 ， 把 文件 作为 一 种 ADT. 
例如 ， 在 C++ 中 执行 如 下 语句 


someFile >> datal 


这 里 someFile 的 类 型 是 <fstream> PAY ifstream, 可 以 把 someFile 人 逻辑 上 看 成 数据 
项 的 线性 序列 ， 当 前 位 置 处 于 序列 中 的 某 个 位 置 。>> 操作 是 获取 在 当前 位 置 的 数据 项 ， 再 
把 当前 位 置 向 前 移 到 序列 中 下 一 个 数据 项 处 。 
物理 上 上， 文件 中 的 数据 项 可 以 在 不 同 的 磁道 和 盘 片 上 ， 而 且 ， 人 硬件 不 维护 当前 物理 位 
， 读 语句 的 逻辑 行为 是 由 操作 系统 软件 控制 的 。 


9.3.3 分配 技术 


本 节 最 后 将 讲述 三 种 物理 层 上 的 存储 分 配 技术 一 一 连续 、 链 接 和 索引 。 每 种 技术 都 要 求 
操作 系统 维护 一 个 目录 ， 记 录 文 件 的 物理 位 置 。 这 个 目录 和 其 他 文件 一 起 存储 在 磁盘 上 。 

如 果 每 个 文件 都 足够 小 并 能 装 进 一 个 块 中 ， 那 么 文件 系统 维护 起 来 就 很 简单 ， 目 录 只 需 
包含 磁盘 上 所 有 文件 的 列表 ， 目 录 中 的 每 个 表 项 会 记录 文件 的 名 字 和 文件 存储 的 块 的 地 址 。 

如 果 文 件 太 大 不 能 装 进 一 个 块 中 ， 那 么 操作 系统 必须 为 它 分 配 多 个 块 。 采 用 连续 分 配 
(contiguous allocation) 时 ， 操 作 系 统 要 使 文件 的 物理 组 织 与 逻辑 组 织 匹 配 ， 把 文件 连续 地 放 
在 一 个 磁道 相 邻 的 块 中 。 

如 果 文 件 太 大 放 不 进 一 个 磁道 中 ， 系 统 会 继续 往 第 二 个 磁道 里 放 。 在 单 面 软盘 中 ， 第 二 
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个 磁道 在 同一 个 盘面 上 与 第 一 个 磁道 相 邻 。 在 双 面 软盘 或 者 便 盘 中 ， 第 二 个 磁道 在 第 一 个 磁 

道 的 同一 柱 面 上 。 如 果 文 件 还 是 太 大 装 不 进 一 个 柱 面 ， 则 将 文件 继续 放 在 相 邻 的 柱 面 上 。 
图 9-18 是 连续 分 配 的 示意 网 。 每 一 行 8 个 块 代表 每 个 磁道 分 为 8 个 朵 区 ， 和 图 9-17b 

一 样 。 每 个 块 上 的 数字 是 块 地 址 ， 是 指定 块 地 址 所 需 三 个 数字 的 简写 形式 ， 块 0 包含 目录 


—- 





.. 


wre) OOOO E E 
JUU JU 
D0000g000 


图 9-18 磁盘 上 的 连续 分 配 


目录 列 出 了 每 个 文件 的 名 字 、 起 始 地 址 和 大 小 。 文 件 TermPaper 从 块 5 开始， 包括 6 
个 块 ， 最 后 三 个 块 从 第 二 个 磁道 继续 。 系 统 为 什么 不 把 块 1 -~ 6 分 配给 该 文件 呢 ? 如 果 另 一 
个 文件 先前 占用 了 块 1 一 4， 然 后 又 被 用 户 从 磁盘 删除 了 ， 就 可 能 出 现 图 中 所 示 的 情况 ， 

图 9-18 中 占用 和 未 占用 的 磁盘 存储 模式 非常 类 似 于 图 9-5 和 9-7 中 占用 和 未 占用 的 主 存 
模式 。 实 际 上 存储 管理 的 问题 都 是 一 样 的 。 当 文件 创建 后 被 删除 ， 存 储 都 会 出 现 碎 片 。 有 可 
能 因为 有 太 多 分 散在 磁盘 上 的 小 洞 而 无 法 创建 一 个 新 文件 ， 为 了 给 新 文件 腾 出 空间 ， 操 作 系 
统 提 供 磁 盘 合 并 工具 ， 用 来 移动 磁盘 上 的 文件 以 制造 出 一 个 大 的 洞 ， 如 图 9-6 所 示 。 

和 主 存 一 样 ， 人 磁盘 的 合并 操作 也 是 非常 耗 时 的 。 为 了 避免 全 并， 操作 系统 可 以 把 文件 存 
储 在 物理 上 分 散在 磁盘 上 的 块 中 。 图 9-19 中 的 链接 分 配 技术 就 是 系统 用 以 维护 这 类 文件 的 
一 种 方式 。 


目录 
Xf 起 始 位 置 
TermPaper 5 


MailingList 18 





19-19 ”磁盘 上 的 链接 分 配 


这 个 目录 包含 文件 第 一 块 的 地 址 .每 个 块 的 最 后 几 个 字 节 保留 给 下 一 块 的 地 址 。 整 个 块 
序列 形成 了 一 个 列表 。 最 后 一 个 块 的 链接 字段 值 为 空 (nil)， 作 为 分 界 符 。 

链接 技术 的 一 个 缺点 是 很 容易 受到 故障 的 影响 在 网 9-19 中 ， 假 设 块 10 的 链接 字段 中 
有 一 个 字 凶 被 破坏 了， 可 以 因为 硬件 故障 或 是 软件 师 洞 操作 系统 还 能 访问 文件 的 前 三 块 ， 
但 是 没有 办 法 知道 后 三 块 在 哪里 . 

图 9-20 中 的 索引 分 配 技 术 把 所 有 地 址 都 放 进 日 录 里 一 个 称 为 索引 (index) 的 链表 中 ， 
这 样 一 来 ， 即 使 索引 中 地 址 10 中 的 一 个 字 节 损坏 了， 操作 系统 只 会 丢失 那 一 个 块 。 


日 K 


i TermPaper 





图 9-20 ”人 磁盘 上 的 索引 分 配 


连续 分 配 相 对 于 非 连续 分 配 的 主要 优点 是 速度 。 如 果 文 件 存储 在 一 个 柱 面 中 ， 就 只 需要 
在 开始 访问 时 等 待 寻 道 和 延迟 时 间 . 整个 文件 的 读 取 速度 只 受到 传输 时 间 的 制约 。 即 使 文件 
不 止 在 一 个 柱 面 上 ， 在 读 完 第 一 个 柱 j 后 ， 也 只 需要 等 一 个 很 短暂 的 、 到 相 邻 柱 面 的 寻 道 时 间 。 
如 果 一 个 文件 的 块 分 散在 整个 磁盘 上 ， 则 每 访问 一 个 块 都 需要 经 历 寻 道 时 间 和 延迟 时 
间 。 即 使 是 使 用 非 连续 分 配 策略 ， 定 期 重新 组 织 一 下 文件 的 物理 布局 ， 使 块 尽量 连续 ， 也 是 
很 值得 的 。 这 个 操作 称 为 磁盘 清理 (defragmenting ) 469 


94 ”错误 检测 和 纠 错 码 


要 想 可 靠 ， 计 算 机 系统 必须 能 够 处 理 物理 错误 ， 这 在 真实 世界 里 是 不 可 避免 的 。 例 如 ， 
如 果 你 通过 因特网 发 送 了 一 封 电子 邮件 ， 传 输 线路 上 的 一 些 静 电 可 能 会 改变 一 个 或 几 个 位 ， 
结果 接收 者 收 到 的 位 和 你 发 送 的 不 完全 一 致 。 再 举 个 例子 ， 系 统 从 主 存 发 送 一 些 数 据 到 磁盘 
驱动 硕 ， 由 于 短暂 的 机 械 问 题 ， 存 储 到 磁盘 上 的 位 模式 可 能 会 改变 . 

对 于 这 类 错误 有 两 种 解决 方法 : 

e 检测 错误 并 重 传 或 丢弃 接收 到 的 消息 

e 纠正 错误 
这 两 种 方法 使 用 的 都 是 给 消息 增加 元 余 位 的 技术 ， 用 以 检测 或 纠正 错误 。 


9.4.1 错误 检测 码 
假设 想 要 传送 一 条 有 关 天 气 情 况 的 消息 ， 有 四 种 可 能 性 一 一 晴 明 、 多 云 、 下 雨 和 下 雪 。 
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发 送 者 和 接收 者 约定 好 用 下 面 的 位 模式 来 对 信息 编码 : 

00, HA BA 

01, $Z 

10, FW 

11, FẸ 
如 果 下 雨 ， 发 送 者 就 发 送 10。 但 是 在 传输 线 上 最 后 的 0 跳 变 成 1， 那 么 接收 者 收 到 11， 会 
错误 地 认为 是 下 雪 。 

检测 是 否 发 生 了 错误 最 简单 的 方法 是 ， 使 用 发 送 者 和 接收 者 共同 确认 的 某 种 计算 方法 向 
消息 中 添加 一 个 元 余 位 ， 称 为 奇偶 位 (parity bit)。 最 常见 的 方法 是 设置 奇偶 位 为 0 或 1， 使 
得 1 的 总 数 为 偶数 。 采 用 这 种 方法 ， 发 送 者 和 接受 者 同意 使 用 下 述 位 模式 ， 其 中 奇偶 位 用 下 
划 线 标明 : 

000, HH 

011, $Z 

101, Fi 

110, FẸ 

现在 假设 发 送 者 发 送 101 的 下 十 消息。 如 果 出 现 错误 把 0 变 成 了 1， 那么 接收 者 会 收 到 
111， 并 知道 发 生 了 错误 ， 因 为 111 不 是 一 个 事先 确定 好 的 位 模式 。 接 收 者 可 以 请 求 重 传 ， 
或 者 丢弃 收 到 的 消息 。 

注意 ， 错 误 发 生 在 奇偶 位 和 错误 发 生 在 某 个 数据 位 一 样 ， 接 收 的 消息 都 是 没有 用 的 。 例 
如 ， 如 果 接 收 者 收 到 111， 他 不 知道 错误 发 生 在 发 送 011 时 第 1 位 错 了 ， 还 是 发 送 101 时 第 
2 位 错 了 ， 抑 或 是 发 送 110 时 第 3 位 错 了 ， 他 只 知道 发 生 了 错误 。 

发 送 者 和 接收 者 也 可 商量 使 用 奇 校 验 。 奇 校 验 是 指 校 验 位 的 计算 是 为 了 让 1 的 总 数 为 奇 
数 。 对 于 发 送 者 和 接收 者 来 说 ， 他 们 只 需要 决定 采用 什么 样 的 奇偶 计算 。 

如 果 传 输 中 出 现 了 两 个 错误 会 怎么 样 呢 ? 比如 不 仅 是 0 变 成 1， 而且 最 后 一 个 1 也 变 成 
了 0， 接 收 者 收 到 110。 但 是 现在 110 是 一 个 约定 好 的 模式 ， 那 么 接收 者 会 错误 地 认为 该 消 
息 是 下 雪 的 意思 。 

位 模式 的 集合 {000, 011, 101, 110} 称 为 编码 (code)， 集 合 中 一 个 单独 的 模式 (例如 
101 ) 称 为 编码 字 (code word)。 上 述 编码 不 能 发 现 两 位 错 ， 它 是 一 位 错 检测 编码 。 错 误 编 
码 会 基于 一 个 很 现实 的 假设 ， 即 发 生 一 位 错 的 概率 要 远 远 小 于 1.0， 因 而 发 生 两 位 错 的 概率 
要 远 远 小 于 发 生 一 位 错 的 概率 。 没 有 哪 种 编码 能 100% 肯定 检测 出 所 有 错误 ， 因 为 总 有 可 能 
同时 出 现 多 个 错误 刚好 把 一 个 编码 字 变 为 男 一 个 编码 字 。 错 误 码 仍然 有 用 ， 因 为 它们 能 处 理 
大 部 分 错误 事件 。 


9.4.2 AWEK 


”假设 要 检测 一 位 或 两 位 错 ， 显 然 需 要 更 多 的 奇偶 位 。 问 题 是 “需要 多 少 奇偶 位 ?” 并 且 
“该 如 何 设计 编码 呢 ? ”答案 涉及 一 种 距离 的 概念 。 两 个 长 度 相同 的 编码 字 之 间 的 海 明 距 离 
(hamming distance) 定义 为 它们 位 不 相同 的 位 置 的 个 数 。 这 是 根据 Richard Hamming 的 名 字 
命名 的 ，1950 年 他 在 贝尔 实验 室 研究 并 得 出 了 这 项 理论 。 

例 9.1 代码 字 多 云 011 和 下 雨 101 之 间 的 海 明 距 离 是 2， 因 为 它们 有 两 个 位 置 上 的 位 
不 相同 ， 即 第 一 位 和 第 二 位 。 口 
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看 看 天 气 编码 {000, 011, 101, 110} 可 以 发 现 ， 所 有 两 个 代码 字 之 间 的 距离 都 是 2。 可 见 
能 够 检测 一 位 错 的 编码 ， 两 个 代码 字 之 间 的 距离 不 能 为 1。 假设 有 这 样 两 个 编码 字 A M B, 
如 果 发 送 者 发 送 A， 传输 中 发 生 了 一 位 错 ， 把 A 和 B 不 同 的 那 一 位 反 转 了 ， 接 收 者 会 以 为 
发 送 的 是 B。 该 编码 无 法 检测 出 这 样 的 一 位 错 。 

编码 距离 (code distance) 是 编码 中 任意 一 对 编码 字 之 间 最 小 的 海 明 距 离 。 

例 9.2 编码 {00110, 11100, 01010, 11101} 的 编码 距离 为 1。 虽 然 几 个 编码 字 之 间 的 
距离 不 全 为 1， 例如 00110 和 11101 的 海 明 距 离 为 4， 但 是 有 一 对 字 之 间 的 距离 仅 为 1， 县 
11100 和 11101。 如 果 用 这 个 编码 发 送 天 气 信 息 ， 还 是 不 能 保证 能 够 发 现 所 有 可 能 的 一 位 传 
输 错误 。 口 

要 设计 一 个 好 的 编码 ， 添 加 奇偶 位 的 方法 要 使 得 编码 距离 尽 可 能 大 。 要 想 发 现 一 位 错 ， 
编码 距离 必须 至 少 为 2。 如 果 要 发 现 两 位 错 ， 编 码 距 离 应 该 为 多 少 呢 ? 不 能 为 2， 因 为 那 意 
味 着 存在 一 对 编码 字 A 和 B 之 间 的 海 明 距 离 为 2， 如 果 发 送 者 发 送 A， 传 输 中 出 现 的 错误 刚 
好 把 使 得 A 区 别 于 B 的 两 位 反 转 ， 接 收 者 就 会 以 为 发 送 的 是 Bo 

图 9-21 是 这 个 概念 的 示意 图 。A 是 A el A el e2 B 
发 送 的 编码 字 ，B 是 最 接近 A 的 编码 字 ， 4-5 — 

两 者 之 间 的 空心 圆 表示 并 未 发 送 但 是 由 CIS 2A | : 
于 传输 错误 有 可 能 接收 到 的 字 。 图 9-21a a) 检测 一 个 错 b) 检测 两 个 错 

中 ， 发 生 一 位 错 可 能 出 现 el， 图 9-21b 图 9-21 错误 检测 编码 的 最 小 海 明 距 离 

中 一 位 错 会 出 现 el ， 两 位 错 会 出 现 e2。 

总 的 来 说 ， 要 发 现 4 位 错 ， 编 码 距 离 必 须 满 足 如 下 公式 

编码 距离 =d+1 
例如 ， 要 检测 三 位 错 ， 编 码 距 离 必须 至 少 为 4， 原 因 是 距离 A 最 近 的 字 至 少 为 4+1， 那 么 就 
不 可 能 反 转 A 的 4 位 把 它 变 成 男 一 个 编码 字 。 

距离 的 概念 对 纠 错 码 也 有 用 。 假 设 对 天 气 消息 采用 如 下 编码 : 

00000, te BH 

01101, 4z 

10110, FW 

11011, FẸ 
如 果 收 到 11110， 如 何 判 断 ? 可 以 说 发 送 的 是 00000， 发 生 了 四 位 错 。 但 是 这 是 一 个 合理 的 
结论 么 ? 不 是 ， 因 为 11110 更 接近 10110， 这 是 下 十 的 代码 字 。 如 果 这 样 判 断 ， 假 设 的 就 是 
发 生 了 一 位 错 ， 发 生 一 位 错 的 概率 要 远 高 于 发 生 四 位 错 的 概率 。 

一 般 来 说 ， 设 计 纠 钳 编 码 要 添加 足够 多 的 奇偶 位 ， 使 得 编码 距离 足够 大 ， 这 样 接收 者 才 
能 纠正 错误 。 接 收 者 纠 错 的 方法 是 计算 收 到 的 字 和 每 个 编码 字 的 海 明 距 离 ， 选 择 最 接近 接收 
到 的 字 的 编码 字 ， 这 里 的 “ 近 ” 是 通过 海 明 距 离 来 定义 的 。 

图 9-22 是 纠 错 概念 的 示意 图 。 同 前 面 一 样 , A 是 发 送 的 编码 字 ,B 是 最 接近 A 的 编码 字 ， 
空心 圆 是 由 于 传输 错误 而 接收 到 的 字 。 图 9-22a 给 出 的 情况 是 编码 能 够 纠正 一 位 错 。 编 码 距 
离 是 3， 所 以 出 现 了 一 位 错 ， 接 收 到 的 el 仍然 距离 A 比 距 离 B 更 近 ， 所 以 接收 者 会 认为 发 
送 的 是 A。 如 果 发 送 A, 并 且 出 现 两 位 错 ， 收 到 了 e2， 接 收 者 会 错误 地 认为 发 送 的 是 Bo 

图 9-22b 展示 的 是 能 够 纠正 两 位 错 的 编码 。 如 果 发 送 A 且 出 现 两 位 错 ， 则 收 到 e2，e2 
距离 A 比 B 更 近 。 只 有 当 距 离 为 5 时 才能 做 到 纠正 两 位 错 。 
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a) 纠正 一 个 错 b) 纠正 两 个 错 
图 9-22 纠 错 码 的 最 小 海 明 距 离 


总 的 来 说 ， 要 纠正 d 位 错 ， 编 码 距 离 必 须 满足 下 面 的 公式 

编码 距离 = 2d+1 
例如 ， 要 纠正 三 位 错 ， 编 码 距 离 必须 至 少 为 7。 这 是 由 接收 方 的 决定 过 程 导致 的 : 如 果 接 收 
方 收 到 的 字 接 近 A， 就 认为 发 送 的 是 A， 而 接收 到 的 字 接 近 B， 就 认为 发 送 的 是 B。A AB 
之 间 的 距离 必须 能 够 容纳 这 两 组 接收 到 的 字 ， 这 也 就 是 公式 中 4 FELL 2 的 原因 。 同 时 距离 也 
必须 是 奇数 ， 所 以 公式 中 要 +1. 如 果 距 离 是 偶数 ， 就 会 出 现 接收 到 的 字 离 A 和 B 一 样 远 ， 
那么 接收 者 台 没 有 办 法 判断 发 送 哪 个 字 的 概率 比较 高 了 -。 

纠正 一 位 错 的 编码 同样 可 以 用 来 检测 两 位 错 ， 因 为 它们 的 编码 距离 都 是 3。 这 取决 于 接 
收 者 想 怎 样 处 理 错 误 。 可 以 假设 没有 发 生 黄 位 错 并 纠正 这 个 错误 ,也 可 以 更 保守 一 些 ， 假 设 
可 能 发 生 了 两 位 错 ， 于 人 径 该 消息 或 者 请 求 重 传 . 


9.4.3 ”纠正 一 位 错 编码 


前 面 一 节 中 我 们 摘 述 了 检测 和 纠正 错误 编码 所 需要 的 编码 距离 。 还 有 一 个 问题 是 如 何 挑 
选编 码 字 以 满足 要 求 的 编码 距离 。 实 际 上 人 们 已 经 设计 出 了 许多 不 同 的 能 够 纠正 多 错误 的 编 
码 方法 ， 本 六 将 讨论 纠正 一 位 错 编码 的 效率 并 讲解 一 种 构建 此 类 编码 系统 的 方法 。 

图 9-23a 给 出 了 一 个 代码 字 的 结构 ， 有 m 个 数据 位 和 7 个 奇偶 位 ， 该 编码 字 共 n= 二 mm 十 r 
位 。 编 码 字 如 果 是 n 位 ， 那 么 接收 到 可 能 的 位 模式 有 | 
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2" 种 。 图 9-23b 是 一 种 分 类 方案 ， 可 以 把 这 些 字 分 为 没 数据 位 
有 错误 和 有 一 位 错误 的 类 。 图 中 给 出 的 是 n = 6 时 的 情 | ‘ l 
oe, el, e2, e3, e4., e5 和 e6 是 六 种 可 能 收 到 的 字 ， a) 编 公 子 的 结构 
和 A 有 一 位 不 同 。 如 果 收 到 这 其 中 的 一 个 ， 接 收 者 会 el 
认为 发 送 的 是 A。 类 似 地 ，e7、e8、e9 、el0、ell 和 
e12 是 与 B 距离 为 1 的 可 能 收 到 的 字 。 也 有 可 能 收 到 其 meres 
他 不 包含 在 这 些 组 里 的 字 ， 对 应 于 传输 中 出 现 多 于 一 个 e5 
错 的 情况 ， 但 是 这 种 情况 下 收 到 的 字 与 任何 编码 字 的 距 ji 
离 不 会 小 于 等 于 1。 有 

一 般 来 说 有 nn 个 字 与 A 的 距离 为 1， 所 以 包括 A sh 
在 内 ， 第 一 组 中 字 的 总 数 是 (n + 1)。 类 似 地 ，B 组 、 e10 
C 组 里 也 都 有 (n+1) 个 字 ， 以 此 类 推 。 每 个 编码 字 有 a 
一 个 组 ， 如 果 有 2" 个 编码 字 ， 那么 就 有 2" 个 组 ， 所 以 人 
图 9-23b 中 字 的 总 数 为 (n +1) 2"。 可 能 还 有 其 他 一 些 收 b) 把 接收 到 的 字 划 分 为 
到 的 字 不 在 图 9-23b 中 ， 但 是 总 数 不 可 能 超过 2". AL, 没有 错 和 有 一 个 错 的 组 


(n + 1)2” S 2" 图 9-23 单 错 误 纠 错 码 的 结构 
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用 n= m+r deem, PRL 2”"， 得 到 

mt+r+{<2" 
这 个 公式 说 明了 在 具有 m 位 数据 位 的 消息 中 ， 要 纠正 一 位 错 需 要 多 少 个 奇偶 位 +。 

使 得 上 述 公 式 为 等 号 关系 的 编码 称 为 完美 编码 - 
(perfect code), 一 个 例子 就 是 m = 4, 三 3。 把 奇偶 位 
和 数据 位 一 起 传输 增加 了 传输 时 间 ， 对 于 这 种 编码 ， 每 
传 4 位 数据 ， 就 要 传 额外 的 3 位 奇偶 位 。 所 以 ， 纠 错 人 码 增 
加 了 3/4 = 75% 的 传输 时 间 开 销 。 如 果 需 要 传输 一 个 很 长 
的 位 流 ， 就 要 把 流 分 割 成 很 多 块 ， 再 为 每 一 个 块 添 加 奇偶 
位 。 块 越 大 ， 开 销 越 小 。 计 算 机 总 是 在 发 送 字 节 流 ， 所 以 
块 的 大 小 总 是 2 HORE. FA 9-24 给 出 了 几 组 产值 为 2 AR 
时 ,，m 和 + 之 间 的 关系 。 图 9-24 单 错 误 纠 错 码 的 开销 

海 明 设 计 了 一 种 非常 聪明 的 方法 来 决定 一 位 纠 错 码 的 奇偶 位 ， 它 的 思想 是 不 要 把 奇偶 位 
放 到 编码 字 的 最 后 ， 而 是 把 他 们 分 散 到 编码 字 中 。 该 技术 的 优点 是 接收 者 可 以 直接 计算 出 
哪 一 位 出 错 ， 而 不 用 计算 接收 到 的 字 与 所 有 编码 字 之 间 123 45 678 9 1011 12 
的 距离 。 图 9-25 给 出 的 是 m = 8, = 4 的 情况 下 奇偶 akdeofoj ii] efo] 
位 的 位 置 。 位 的 位 置 从 左 往 右 依次 编号 ,奇偶 位 的 位 家 分 图 925 具有 8 个 数据 位 的 单 错误 纠 
别 是 1、2、4、8， 即 2 的 窜 数 。 这 里 的 示例 中 ， 传 输 的 数 错 码 中 4 个 奇偶 位 的 位 置 
据 是 1001 1100, 但 是 这 些 位 在 编码 字 中 不 是 连续 存储 的 。 

每 个 位 的 位 置 编号 可 以 写成 唯一 的 一 个 2 的 才 数 相 加 之 和 ， 如 下 : 








Wl 
EC ee 
o e 
Ca 





l=1 5=1+4 9=1+8 
2=2 6=2+4 10=2+8 
3x42 7=1+2+4 il1=1+2+8 
4=4 8=8 12=4+8 


要 确定 在 位 置 1 的 奇偶 位 的 值 ， 注 意 它 出 现在 位 置 1、3、5、7、9 和 11 的 求 和 公式 的 右边 。 
使 用 偶 校 验 的 话 ， 要 把 该 奇偶 位 设置 为 使 得 这 些 位 置 中 1 的 总 个 数 为 偶数 。 位 置 3、7 和 9 
是 1， 所 以 1 的 个 数 是 奇数 ， 因 此 在 位 置 1 的 奇偶 位 的 值 应 该 设置 为 1。 每 个 奇偶 位 要 检测 
的 位 置 分 别 是 : 

奇偶 位 1 m1, 3, 5, 7, 9, 11 

奇偶 位 2 mM 2, 3, 6, 7, 10, 11 

4h 4 ew 4, 5, 6, 7, 12 

奇偶 位 8 M8, 9, 10, 11, 12 
你 可 以 自己 计算 一 下 编码 字 中 其 他 儿 个 奇偶 位 ， 验 证 结果 111100101100. 

现在 假设 发 送 了 该 编码 字 ， 在 传输 过 程 中 位 置 10 的 值 发 生 了 错误 ， 接 收 者 收 到 的 是 
111100101000， 可 以 看 出 位 置 2 和 8 上 接收 到 的 奇偶 位 和 计算 出 来 的 奇偶 位 是 不 同 的 。 因 为 
2 十 8 三 10， 所 以 可 知 在 位 置 10 的 位 错 了 ， 把 位 置 10 的 值 反 转 ， 就 纠正 了 错误 。 这 种 纠 错 
技术 的 好 处 是 接收 者 不 需要 把 接收 到 的 字 与 所 有 编码 字 进 行 比较 以 确定 它 离 哪个 编码 字 最 近 。 


95 RAID 存储 系统 
在 计算 机 发 展 早期 ， 磁 盘 体积 大 且 昂 贵 。 随 着 技术 的 进步 ， 磁 盘 体积 变 小 ， 数 据 容积 增 
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成 一 个 驱动 器 阵列 ， 这 样 比 构造 一 个 超大 的 驱动 需 更 划算 。 这 样 的 驱动 器 组 合 称 为 廉价 磁盘 
匈 余 阵列 (Redundant Array of Inexpensive Disks, RAID) 系统 。 

RAID 的 思想 是 相对 于 只 有 一 个 转轴 的 大 磁盘 驱动 器 来 说 ， 磁 盘 阵 列 有 更 多 转轴 ， 每 个 
都 有 自己 的 一 组 读 / 写 头 ， 可 以 并 发 操作 。 同 时 ， 宛 余 也 可 以 用 来 纠正 和 检测 错误 ， 增 加 系 
统 的 可 靠 性 。RAID 控制 右 癌 操作 系统 提供 了 一 层 抽象 ， 使 得 磁盘 阵列 看 上 去 像 一 个 很 大 的 
磁盘 。 相 应 地 ， 也 可 以 由 软件 来 提供 这 层 抽 象 ， 作 为 操作 系统 的 一 部 分 。 

有 几 种 不 同 的 组 织 磁 盘 阵 列 的 方式 ， 几 种 最 常见 方案 的 工业 标准 术语 是 : 
RAIDO 级: 非 元 余 条 带 化 
RAID 1 级 : 镜像 
RAID 01 和 10 级: 条 带 化 和 镜像 
RAID 2 级 : 内 存 风 格 的 ECC 
RAID 3 KR: 位 交叉 奇偶 校 验 
RAID 4 级 : 块 交 叉 奇 偶 校 验 
RAIDS KR: 块 交叉 分 布 奇 偶 校 验 
每 种 组 织 方式 都 有 各 自 的 优点 和 缺点 ， 适 用 于 不 同 的 场景 。 本 节 接 下 来 将 介绍 上 述 各 种 等 级 
的 RAID. 


9.5.1 RAID 0 级: FERRARE 


图 9-26 是 RAID 0 级 的 组 织 结构 。 本 来 应 该 存储 在 连续 块 中 的 数据 被 分 成 了 条 带 ， 分 
布 在 阵列 中 的 几 个 磁盘 上 。 图 9-18 中 块 
0 一 7 在 一 条 磁道 上 ,8 一 15S 在 下 一 条 磁 
道上 ， 以 此 类 推 。 一 个 条 带 包 括 几 个 块 ， 
例如 ， 如 果 每 个 条 带 2 个 块 ， 那 么 图 9-18 
中 的 块 0 和 块 1 存在 条 带 0 上 ， 块 2 AIR 3 
存在 条 带 1 上 ， 以 此 类 推 。 

操作 系统 看 到 的 是 图 9-18 所 示 的 逻辑 
磁盘 ， 而 实际 物理 磁盘 如 图 9-26 所 示 。 如 果 操 作 系 统 请 求 磁盘 读 块 0 一 7，RAID 系统 会 并 
行 地 读 条 带 0 一 3， 并 发 可 降低 访问 时 间 。 如 果 要 服务 一 个 读 块 0 ~ 10 的 请 求 ， 也 就 是 条 
带 0 一 5， 则 第 一 块 磁盘 需要 顺序 传输 条 带 0 和 条 带 4， 第 二 块 磁盘 也 同样 需要 顺序 传输 条 
带 1 和 条 带 5。 这 样 的 组 织 架 构 需 要 至 少 两 块 硬 盘 。 

0 级 的 优点 是 提高 了 性 能 ， 但 是 如 果 大 多 数 读 / 写 请 求 的 都 是 同一 个 块 或 者 同一 个 条 人 带 ，0 
级 的 问题 就 显现 出 来 了 ， 因 为 这 种 情况 下 没有 并 行 性 。 同 时 ， 它 也 不 像 其 他 级 一 样 有 宛 余 ， 所 
以 可 靠 性 不 是 很 高 。 假 设 所 有 磁盘 质量 都 相同 ， 那 么 四 块 磁盘 同 
时 运行 出 现 故障 的 概率 比 只 运行 一 块 磁盘 出 现 故障 的 概率 要 高 。 


95.2 RAID 1 级 : 镜像 


对 磁盘 做 镜像 是 指 在 另 一 块 独立 的 磁盘 上 维护 这 块 磁盘 的 
完全 一 致 的 映像 ， 如 图 9-27 所 示 。 不 做 条 带 划 分 ， 只 是 严格 复 
制 Fe PETC AS A Bi a ES SK oh A A BE o 图 9-27 RAID 1 级 : 镜像 





图 9-26 RAID 0 级: 非 元 余 条 带 化 





磁盘 写 要 求 写 到 两 个 磁盘 上 ， 不 过 这 可 以 并 行 ， 所 以 写 性 能 不 会 比 写 一 个 磁盘 差 很 多 。 
对 于 磁盘 读 ， 控 制 关 可 以 选择 从 具有 最 短 寻 道 时 间 和 延迟 的 磁盘 读 。 所 以 磁盘 读 的 性 能 比 只 
有 一 个 磁盘 要 好 ,如果 一 个 磁盘 坏 掉 了 ， 在 更 换 它 的 同时 ， 为 一 个 磁盘 可 以 继续 运行 。 当 替 
换 磁盘 装 好 之 后 ， 可 以 复制 好 的 磁盘 ， 很 容易 备份 好 新 盘 。 只 有 两 个 磁盘 的 时 候 ， 通 常会 采 
用 镜像 ; 如 果 有 四 个 磁盘 ， 通 常 使 用 01 级 的 条 市 化 ， 这 样 能 够 市 来 性 能 提升 ， 效 果 更 好 。 


95.3 RAID 01 级 和 10 级: 条 带 化 和 镜像 


可 通过 两 种 方式 把 RAID 0 级 和 1 级 结合 起 来 ， 从 而 同时 具备 两 者 的 优势 。 第 一 种 称 为 
RAID 01 级 , 或 0 十 1、0/1、“ 镜 像 的 条 带 ”， 如 图 9-28a 所 示 。 采 用 镜像 的 条 带 方 式 ， 只 需 
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b) RAID 10 级 ， 条 带 化 镜像 
图 9-28 将 RAID 0 级 和 1 级 组 合 起 来 


镜像 复制 0 级 条 带 化 的 磁盘 结构 。 第 二 种 是 RAID 10 级 , 或 1 十 0、1/0、“ 条 带 化 的 镜像 ”， 
如 图 9-28b 所 示 。 不 是 用 宛 余 的 磁盘 复制 0 级 的 磁盘 ， 而 是 让 所 有 磁盘 结对 做 镜像 ， 然 后 再 
在 这 些 镜像 之 间 做 条 带 化 。 
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RAID 10 级 实现 起 来 比 01 级 代价 高 一 些 。 图 9-28a 中 的 01 级 ， 每 个 条 带 控制 器 形成 一 
个 系统 ， 使 得 四 个 条 带 化 的 磁盘 对 镜像 控制 器 来 说 看 上 去 像 一 个 磁盘 。 镜 像 控制 器 是 使 得 两 
个 镜像 磁盘 对 计算 机 来 说 看 上 去 像 一 个 磁盘 的 系统 。 而 图 9-28b 中 的 10 级 ， 每 个 镜像 控制 
器 使 得 两 个 互 为 镜像 的 磁盘 对 于 条 带 控制 器 来 说 像 一 个 磁盘 。 条 带 控制 器 使 得 四 个 条 带 化 的 
磁盘 对 于 计算 机 来 说 看 上 去 像 一 个 磁盘 。 在 这 里 例子 中 有 八 个 磁盘 ， 对 于 01 级 来 说 需要 三 
个 控制 器 ， 而 对 于 10 级 来 说 需要 五 个 控制 器 。 

10 级 相对 于 01 级 的 优势 是 可 靠 性 。 假 设 有 一 块 物理 磁盘 坏 了 ， 比 如 说 第 三 块 。 
图 9-28a 中 ， 首 先 第 一 个 条 带 控 制 器 会 问 镜 像 控 制 吉 报错， 然后 镜像 控制 器 会 使 用 右边 的 镜 
像 磁 盘 ， 直 到 故障 盘 被 替换 。 实 际 上 在 整个 故障 期 间 ， 左 边 四 个 物理 磁盘 都 是 不 工作 的 。 在 
图 9-28b 中 ， 第 三 块 盘 损坏 会 导致 第 二 个 镜像 控制 恬 只 使 用 第 四 块 盘 (第 二 块 镜像 磁盘 )， 直 
到 故障 盘 被 替换 。 在 故障 期 间 ， 只 有 一 块 物理 磁盘 是 不 工作 的 。 

在 两 种 情况 中 ,计算 机 看 到 的 RAID 磁盘 的 服务 都 是 不 间断 的 ， 看 上 去 可 靠 性 好 像 是 
一 样 的 。 但 是 如 果 有 两 块 盘 同时 坏 掉 ， 问 题 就 来 了 . 图 9-28a 中 ， 如 果 一 块 坏 盘 在 左边 的 条 
市 磁 盘 中 ， 另 一 块 在 右边 ， 那 么 RAID 磁盘 整个 出 现 故障 。 如 果 两 块 坏 盘 在 同一 组 箱 磁盘 
H, IBA RAID 磁盘 还 能 工作 。 图 9-28b 中 ， 只 有 同一 对 镜像 磁盘 都 坏 了 ，RAID 磁盘 才 不 能 
工作 ， 这 个 概率 要 小 于 01 级 RAID 故障 的 概率 。 本 章 后 面 有 关于 这 个 问题 量化 分 析 的 练习 。 

与 01 RE, 10 级 还 有 一 个 优势 是 在 故障 盘 被 替换 后 做 镜像 拷贝 的 时 间 更 短 。 图 9-28a 
中 ， 镜 像 控 制 器 把 每 个 条 带 磁 盘 当 作 一 个 整体 ， 而 不 是 四 块 独立 的 磁盘 。 每 次 修复 时 ， 镜 像 
控制 只 能 把 整个 好 的 条 带 服务 器 ( 即 四 块 盘 ) 的 内 容 都 复制 到 修复 好 的 条 带 磁 盘 上 。 而 在 10 
级 中 ， 所 有 镜像 都 在 一 对 磁盘 上 完成 ， 修 复 一 块 故障 盘 只 需要 拷贝 一 块 硬盘 的 内 容 。 

kim RAID 系统 通常 支持 01 级 ， 而 高 端 系 统 既 支持 01 又 文 持 10。 和 采用 这 样 的 系统 ， 
就 能 既 获 得 条 带 化 的 性 能 优势 ， 又 获得 镜像 的 可 靠 性 优势 。 在 有 些 情况 下 读 性 能 甚至 好 于 0 
级 。 考 虑 这 样 一 个 场景 ，01 级 系统 ， 读 请 求 条 带 0 一 $。 条 带 0 一 3 可 以 从 第 一 组 驱动 大 上 并 
发 读 ， 条 带 4 和 条 带 5 可 以 从 镜像 上 并 发 读 。01 级 和 10 级 都 要 求偶 数 个 硬盘 ， 最 少 需要 四 块 。 


95.4 ”RAID 2 级 : 内 存 风格 的 ECC 


镜像 的 存储 开销 是 巨大 的 ， 达 到 100%， 因 为 每 块 盘 都 被 复制 了 。 图 9-24 是 单 错误 纠 
“if ( single-Error-Correcting Code，ECC)， 它 的 开销 更 小 ， 通 常用 在 高 可 靠 的 存储 系统 中 。 
用 三 个 奇偶 位 纠 错 四 个 数据 位 ， 开 销 降 到 75%。 它 使 用 2 级 系统 ， 在 位 级 别 上 划分 条 带 。 
图 9-29 给 出 了 每 个 半 字 节 在 前 四 个 磁盘 上 的 分 布 。 后 三 个 磁盘 是 单 错误 纠 错 码 的 奇偶 校 验 位 。 





图 9-29 RAID 2 级 : 内 存 风 格 的 ECC 


为 了 保持 性 能 ， 驱 动 器 的 旋转 必须 同步 。 完 成 一 次 硬盘 写 ， 磁 盘 控 制 右 计算 每 个 半 字 他 
的 奇偶 校 验 位 ， 写 数据 的 同时 写 人 校 验 磁盘 。 读 的 时 候 ， 控 制 右 从 数据 计算 出 校 验 位 ， 把 它 
们 和 从 校 验 盘 中 读 出 的 位 进行 比较 ， 如 果 有 错误 就 进行 修正 。 
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这 种 方案 用 在 一 些 比较 老 的 超级 计算 机 上 ， 通 常 是 32 个 数据 位 和 6 个 奇偶 校 验 位 ， 以 保 
证 开销 较 小 。 今 天 ,便宜 的 磁盘 都 有 内 部 位 级 纠 错 能 力 ， 所 以 2 级 系统 在 商业 上 不 再 使 用 了 。 


9.5.5 RAID 3 oy 位 交叉 奇偶 校 验 


到 目前 为 止 ， 磁 盘 阵 列 中 最 常见 的 故障 是 阵列 中 有 一 块 磁 盘 损 坏 ， 而 磁盘 控制 器 可 以 发 现 
这 样 的 故障 ， 所 以 系统 知道 故障 在 哪里 。 如 果 在 位 级 做 条 带 化 ,那么 假如 知道 哪 一 位 坏 掉 了 ， 
只 用 一 个 奇偶 位 就 可 以 修复 该 错误 。 人 例如， 假设 要 修复 半 字 节 1001， 使 用 偶 校 验 ， 奇 偶 位 是 
0， 那 么 存储 1001 0。 图 9-30 显示 1001 分 别 存在 位 0、 位 1、 位 2、 位 3， 而 奇偶 位 0 存在 P0 ~ 3. 





图 9-30 RAID 3 级 : 位 交叉 奇偶 校 验 


假设 第 四 块 盘 坏 了 ， 所 以 知道 位 3、7、11、15 等 不 可 用 了 。 需 要 读 的 数据 是 100x0，x 
是 必须 修复 的 位 。 因 为 使 用 的 是 偶 校 验 ， 所 以 1 的 个 数 必须 为 偶数 ， 所 以 x 必定 为 1。 知道 
错误 发 生 在 哪里 有 助 于 将 单 错误 纠 错 码 的 开销 降低 到 1 个 奇偶 位 。 

虽然 3 级 系统 比 2 级 系统 提高 了 效率 ， 但 还 是 有 一 些 缺 点 。3 级 系统 的 故障 磁盘 恢复 非 
常 费时 。 使 用 镜像 ， 只 需 把 剩 下 的 好 盘 的 内 容 殉 隆 到 蔡 换 盘 ， 但 是 对 于 位 交叉 奇偶 校 验 ， 新 
替换 的 磁盘 上 的 位 必须 从 其 他 磁盘 上 的 位 计算 而 来 ， 因 此 必须 先 访问 这 些 位 。 重 建 通常 是 由 
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只 有 当 磁 盘 故障 需要 纠 错 并 恢复 替代 盘 的 时 候 ， 才 会 使 用 奇偶 盘 。 所 以 ， 每 次 写 请 求 都 
要 更 新 奇偶 位 。 因 为 每 个 磁盘 驱动 器 在 位 级 都 有 目 己 的 ECC， 所 以 每 次 读 请 求 时 不 需 访 问 
奇偶 盘 (除非 有 驱动 器 坏 了 )。3 级 系统 的 访问 时 间 并 不 比 单个 磁盘 的 访问 时 间 长 ,但 是 2 级 
和 3 级 要 求 每 次 读 / 写 请 求 都 访问 每 块 数据 盘 ， 所 以 无 法 获得 较 大 条 吊 市 来 的 并 发 性 。 


9.5.6 RAID 4 级 : 块 交叉 奇偶 校 验 


3 级 和 4 级 的 唯一 区 别 是 条 带 的 大 小 。3 级 中 条 带 是 1 位 大 小 的 ， 而 4 级 中 条 市 是 一 个 
或 多 个 块 。 图 9-30 中 P0-3 代表 1 位 ， 但 在 图 9-31 中 P0-3 表示 整个 条 带 。 





图 9-31 RAID 4 级 : 块 交 叉 奇 偶 校 验 


例如 ， 如 果 每 个 条 带 是 1Kb 大 小 ， 那 么 一 个 文件 在 条 这 上 的 分 布 如 下 : 
条 带 0: 位 0 一 1023 
条 带 1: 位 1024 ~ 2047 
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条 带 2: 位 2048 ~ 3071 

条 带 3: 位 3072 ~ 4095 
P0-3 的 第 1 位 是 位 0、1024、2048 和 3072 的 奇偶 校 验 位 ，P0 一 3 的 第 2 位 是 1、1025、 
2049 和 3073 的 奇偶 校 验 位 ; 以 此 类 推 。 因 为 条 带 不 是 位 级 别 上 的 , 与 2 级 和 3 级 不 同 ， 所 
以 磁盘 的 旋转 不 需要 同步 。 

4 级 相 比 起 3 级 来 说 ， 对 于 小 的 随机 读 请 求 更 有 优势 。 如 果 每 个 文件 的 条 市 都 分 布 在 不 
同 的 磁盘 上 ， 那 么 寻 道 、 延 人 运 和 传输 都 可 以 并 行 发 生 。 在 3 级 系统 中 ， 即 使 只 是 读 一 个 小 文 
件 ， 也 要 求 所 有 数据 驱动 器 都 保持 一 致 工作 ， 多 个 小 文件 必须 顺序 地 读 。 

虽然 比 起 镜像 组 织 来 ，4 级 的 开销 已 经 大 幅 减 少 ,但 是 它 最 大 的 问题 是 写 请 求 。 如 果 要 
写 一 个 跨越 条 带 0 ~~ 3 的 文件 ， 可 以 计算 P0-3 的 奇偶 位 ， 在 写 数据 的 同时 写 人 奇偶 校 验 磁 
盘 。 但 是 假设 要 写 的 文件 只 包含 在 条 带 0 内 ， 那 么 要 改变 条 带 0 就 必须 改变 P0-3， 而 P0-3 
除了 是 条 带 0 的 校 验 盘 ， 同 时 也 是 条 带 1、2 和 3 的 校 验 盘 。 看 上 去 需要 读 条 带 1、2、3 和 
新 的 条 带 0 一 起 计算 新 的 校 验 位 。 不 过 有 更 有 效 的 方法 ， 不 需要 读 条 带 1、2 和 3， 只 需 读 
出 旧 的 条 融 0 和 旧 的 P0-3。 对 于 新 旧 数 据 条 带 中 每 个 位 的 位 置 ， 如 果 新 的 位 不 同 于 旧 的 位 ， 
那么 就 会 把 1 的 数量 从 偶数 变 为 奇数 (或 从 奇数 变 为 偶数 )， 所 以 必须 反 转 PO ~ 3 中 对 应 的 
位 。 如 果 新 值 和 旧 值 相同 ， 相 应 的 奇偶 位 就 可 以 保持 不 变 。 对 于 四 个 数据 磁盘 ， 这 项 技术 可 
以 把 磁盘 读 次 数 从 3 减 为 2。 

即使 采用 这 样 的 技术 ， 每 次 写 请 求 都 会 要 求 对 奇偶 盘 进 行 一 次 写 ， 不 管 请 求 有 多 小 ， 因 
此 奇偶 盘 会 成 为 性 能 瓶颈 。 


95.7 RAID 5 级 : 块 交叉 分 布 奇偶 校 验 


5 级 系统 能 消除 奇偶 盘 成 为 瓶 颈 的 现象 。 它 不 会 把 所 有 奇偶 位 都 存储 在 一 个 盘 上 ， 而 是 
把 奇偶 信息 分 散在 所 有 盘 上 ， 这 样 就 没有 一 块 盘 需 要 负责 整个 阵列 的 奇偶 信息 了 。 

图 9-32 给 出 了 一 种 常见 的 组 织 架构 ， 称 为 左 对 称奇 偶 校 验 分 布 ， 把 奇偶 信息 分 布 到 所 
有 磁盘 上 。 它 的 优点 是 如 果 顺 序 读 一 组 条 带 ， 会 先 访问 所 有 磁盘 一 次 ， 然 后 绸 访问 第 二 次 。 
图 中 假设 按照 条 带 0、1 、2、3、4 的 顺序 访问 ， 会 依次 访问 第 一 、 第 二 、 第 三 、 第 四 和 第 五 
块 磁盘 。 如 果 把 条 带 4 放 到 图 中 条 带 5 的 位 置 ， 就 需要 按 顺 序 访问 第 一 、 第 二 、 第 三 和 第 一 
块 磁盘 ， 也 就 是 访问 了 第 一 块 磁盘 两 次 ， 却 一 次 都 没有 访问 第 五 块 磁盘 。 可 以 看 到 无 论 从 哪 
个 条 带 开始 访问 ， 这 个 属性 都 是 成 立 的 。 





图 9-32 RAID 5 级 : 块 交 叉 分 布 奇 偶 校 验 


5 级 RAID 是 高 可 靠 性 、 高 性 能 、 高 容量 和 低 存 储 开 销 的 理想 组 合 ， 是 目前 最 流行 的 高 
端 RAID 系统 。 最 流行 的 低 端 系统 可 能 是 RAID 0 级 ， 它 并 不 是 一 个 真正 意义 上 的 RAID， 
因为 没有 宛 余 ， 所 以 也 没有 增强 可 靠 性 。 
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操作 系统 以 CPU 利用 率 的 方式 分 配 时 间 ， 以 主 存 和 磁盘 分 配 的 方式 分 配 存储 。 分 配 主 
存 有 五 种 技术 : 单 道 程序 设计 ， 固 定 分 区 多 道 程序 设计 ， 可 变 分 区 多 道 程序 设计 ， 分 页 和 虚 
拟 内 存 。 采 用 单 道 程序 设计 ， 从 头 到 尾 都 只 有 一 个 作业 在 执行 ， 该 作业 占用 整个 主 存 。 固 定 分 
区 多 道 程序 设计 人 允许 几 个 作业 同时 执行 ， 要 求 操作 系统 在 执行 任务 前 决定 内 存 分 区 的 大 小 。 可 
变 分 区 多 道 程序 设计 允许 根据 作业 的 要 求 调整 分 区 的 大 小 ,减轻 了 固定 分 区 多 道 程序 设计 中 国 
有 的 低 效 率 问题 。 最 优 适 配 和 最 先 适 配 是 处 理 可 变 分 区 多 道 程序 设计 的 碎片 问题 的 两 种 策略 。 

分 页 通过 把 程序 分 段 装 进 内 存 的 洞 里 , 减轻 了 碎片 问题 。 程 序 不 再 连续 ， 而 是 分 段 并 分 
散在 主 存 中 。 作 业 被 划分 为 大 小 相等 的 页 ， 主 存 也 被 划分 成 同样 大 小 的 帧 。 程 序 员 看 到 的 逻 
辑 地 址 借助 于 页 表 被 翻译 为 物理 地 址 。 页 表 包 含 每 个 存储 在 主 存 中 页 的 帧 号 。 

按 需 分 页 也 称 为 虚拟 内 存 ， 直 到 作业 需要 某 一 页 时 才 把 它 装载 进 内 存 。 执 行 并 不 要 求 整 
个 程序 都 装 进 主 存 ， 相 反 ， 只 有 称 为 工作 集 的 活跃 页 才 装 进 内 存 。 先 进 先 出 (FIFO) 和 最 近 
最 少 被 使 用 (LRU) 是 两 种 算法 ， 用 来 决定 当 新 页 需要 一 个 帧 来 存放 时 ， 应 将 主 存 中 的 哪 一 
页 蔡 换 出 去 。 通 常人 们 会 期 望 随 着 内 存 帧 数 的 上 升 缺 页 数 应 该 下 降 ， 但 是 Belady 异常 表明 
采用 FIFO 替换 算法 时 ， 帧 数 的 增加 可 能 会 导致 缺 页 数量 的 增加 。 

磁盘 访问 时 间 由 三 部 分 组 成 : 寻 道 时 间 ， 这 是 机 械 臂 移 到 指定 柱 面 花 费 的 时 间 ; 延迟 ， 
这 是 当 机 械 臂 到 位 后 ， 块 旋转 到 读 / 写 头 的 时 间 ; 传输 时 间 ， 这 是 块 经 过 读 / 写 头 的 时 间 。 
磁盘 管理 的 三 项 技术 是 连续 、 链 接 和 索引 。 和 主 存 一 样 ， 磁 盘存 储 也 有 碎片 的 问题 。 

可 以 往 数 据 位 中 添加 一 些 匈 余 位 以 发 现 或 纠正 数据 传输 或 存储 中 可 能 发 生 的 错误 。 两 个 
代码 字 之 间 的 海 明 距离 是 不 同位 的 个 数 。 接 收 者 通过 选择 距离 接收 到 的 字 海 明 距 离 最 近 的 编 
码 字 来 纠正 错误 。 通 过 正确 选择 见 余 位 放置 的 位 置 ， 可 以 不 用 把 接收 到 的 字 与 所 有 编码 字 都 
做 比较 就 纠正 一 位 错误 。 

廉价 磁盘 元 余 阵 列 (RAID) 是 一 组 磁盘 ， 在 操作 系统 看 来 就 好 像 是 一 个 大 的 磁盘 。 
RAID 系统 的 两 个 优势 是 性 能 和 可 靠 性 : 性 能 来 源 于 系统 中 有 多 转轴 实现 的 并 发 数据 访问 ; 
可 靠 性 来 源 于 宛 余 磁 盘 驱 动 器 实现 的 错误 纠正 和 错误 发 现 。 


练习 
9.1 节 | 

1. 采用 图 9-4 中 的 格式 ， 设 计 一 个 作业 执行 序列 ， 使 得 最 先 适 配 算法 比 最 优 适 配 算法 先 需要 合并 压 
缩 。 画 出 每 种 算法 在 需要 合并 之 前 主 存 的 碎片 情况 。 

2. 图 9-10 是 一 个 分 页 系统 的 页 表 ， 它 起 到 和 多 道 程序 设计 系统 中 基 址 寄存 器 一 样 的 翻译 逻辑 地 址 的 
作用 。 图 中 没有 给 出 边界 寄存 器 对 应 的 功能 是 如 何 完成 的 。( a) 要 保护 进程 的 内 存 空 间 不 受 非 法 
访问 ， 分 页 系统 是 否 需 要 边界 值 表 ? 每 页 一 个 还 是 一 个 边界 寄存 器 就 足够 了 ? (b) 修改 图 9-10， 
加 上 不 受 其 他 进程 非法 访问 的 内 存 保护 机 制 。 

3. 假设 一 个 分 页 系统 的 页 大 小 是 512 FAT. (a) 如 果 大 多 数 文 件 都 很 大 ， 比 512 字 节 大 很 多 ， 那 么 
每 个 文件 的 平均 内 部 碎片 大 小 是 多 少 (以 字 节 为 单位 的 未 使 用 空间 ) ? 解释 你 的 推理 。(b) 如 果 大 
多 数 文 件 都 远 小 于 512 FT, BBA (a) 部 分 中 间 题 的 答案 是 什么 ?(c) 如 果 以 未 使 用 空间 的 比率 
而 不 是 未 使 用 字 节 数 来 表示 碎片 ， 那 么 (b) 问题 的 答案 又 该 是 什么 ? 

9.2 节 

4. 一 个 计算 机 具有 12 位 地 址 和 划分 为 16 个 帧 的 主 存 。 内 存 管理 使 用 按 需 分 页 。* (a) 虚拟 内 存 有 

多 少 字 市 ?(b) 每 页 中 有 多 少 字 节 ? (c) 逻辑 地 址 和 物理 地 址 的 偏 移 量 是 多 少 位 ?9 ( d) 一 个 作业 的 
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页 表 中 最 多 有 多 少 表 项 ? 
. 对 一 个 具有 位 地 址 和 内 存 划 分 为 2 个 帧 的 计算 机 ， 回 答 练 习 4 中 的 问题 . 
.图 9-12 中 哪些 页 磁盘 映像 和 内 存 中 的 页 是 完全 一 致 的 ? 
图 9-15b 展示 的 是 Belady 异常 ， 针 对 书 中 给 出 的 页 引用 序列 进行 验证 。 以 图 9-13 中 的 格式 展示 
帧 的 内 容 。 
*8. 设计 一 个 12 个 页 引用 的 序列 ， 使 得 FIFO 页 蔡 换算 法 比 LRU 算法 好 。 
9. 采用 FIFO 页 替换 算法 针对 图 9-13 的 页 引用 序列 ， 画 出 类 似 图 9-15b 所 示 的 图 。 
*10. 如 果 操 作 系统 能 够 预测 未 来 ， 它 会 选择 能 使 下 一 次 缺 页 尽 可 能 迟 发 生 的 页 面 来 替换 。 这 样 的 算法 
称 为 OPT， 即 最 优 页 替换 算法 -. 这 是 一 个 很 有 用 的 理论 算法 ， 因 为 它 代表 你 能 做 到 的 最 好 情况 。 
当 设 计 者 衡量 页 替换 算法 时 ， 会 试 着 尽量 接近 OPT 的 性 能 。 对 于 图 9-13 和 网 9-16 中 的 序列 ， 
OPT 会 引起 的 缺 页 次 数 是 多 少 ?” Al FIFO 和 LRU 相 比 如 何 ? 
9.3 节 
11. 假设 一 块 磁盘 每 分 钟 旋转 5400 转 ， 每 个 盘面 分 为 16 个 而 区 。*#(a) 可 能 的 最 大 延迟 时 间 是 多 少 ? 
(b) 可 能 的 最 小 延迟 时 间 是 多 少 ? 什么 情况 下 会 发 生 ? (Cc) 根据 (a) M (b), 平均 延迟 时 间 是 多 
少 ? (d) 一 个 块 的 传输 时 间 是 多 少 ? 
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947 
12.* (a) 存储 一 个 0 一 9 的 十 进 制 数字 需要 多 少数 据 位 ? * (b) 检测 出 一 位 错 需 要 多 少 奇 偶 校 验 位 ? 
485 (c) 写 出 一 个 使 用 偶 校 验 的 单 错误 检测 码 。 奇 偶 位 用 下 划 线 标 出 。(d) 你 的 编码 的 编码 距离 是 多 少 ? 


13. (a) 要 检测 出 五 位 错 ， 编 码 距离 至 少 为 多 少 ?(b) 要 纠正 五 位 错 ， 编 码 距 离 至 少 为 多 少 ? 

14. (a) 图 9-24 中 哪些 表 项 表示 完美 编码 ? (b) 补充 图 9-24 PHR, 包括 m = 4 和 m = 128 之 间 的 所 有 
完美 编码 ， 还 要 写 出 开销 值 。(c) 关于 把 数据 位 数 限制 为 2 的 寡 会 带 来 的 开销 ， 可 以 得 出 什么 结论 ? 
15. 传输 8 个 数据 位 的 一 组 数据 ， 使 用 图 9-25 中 的 单 错 误 纠 错 码 。 对 于 收 到 的 下 列 每 个 位 模式 ， 说 明 

是 否 发 生 错误 。 如 果 发 生 请 纠正 。 


* (a)100110101001 (b)110100110010 
(c)000010110100 (d)101100100100 


9.5 节 

17. 图 9-28 中 的 RAID 系统 有 8 个 物理 磁盘 。(a) 如 果 用 6 个 物理 磁盘 ， 对 于 01 级 和 10 级 系统 ， 各 
需要 多 少 个 镜像 控制 顺和 条 带 控 制 器 ? (Cb) 通常 有 2n 个 磁盘 (图 9-28 中 是 nn = 4)， 对 于 01 级 和 
10 级 系统 ， 各 需要 多 少 个 镜像 控制 器 和 条 带 控制 器 ? 

18. (a) 图 9-28 给 出 的 是 具有 8 个 物理 磁盘 的 RAID 01 级 和 10 级 系统 。 画 出 四 个 物理 磁盘 相应 的 01 
级 和 10 级 系统 。(b) 假设 坏 了 两 个 磁盘 。 序 列 BBGG 意思 是 第 一 个 和 第 二 个 磁盘 坏 了 ， 第 三 个 
和 第 四 个 是 好 的 。 在 这 种 情况 下 ，RAID 01 级 系统 是 好 的 ， 因 为 坏 的 两 个 磁盘 是 在 同一 组 条 带 化 
的 磁盘 上 ， 而 RAID 10 级 就 不 能 正常 工作 了 ， 因 为 坏 掉 的 两 个 磁盘 在 同一 组 先 做 镜像 的 磁盘 中 。 
有 2 个 B 和 2 个 G 的 四 个 字母 的 组 合 有 多 少 种 变化 ?(c) 画 出 每 种 变化 并 确定 对 01 级 和 10 级 来 
说 ， 此 时 RAID 系统 是 否 能 正常 工作 。( d) 如 果 两 个 磁盘 故障 ， 根 据 (c) 部 分 ,确定 01 级 和 10 级 
RAID 能 够 正常 工作 的 概率 。 哪 种 RAID 系统 更 可 靠 ? (e) 通常 有 2n 个 磁盘 (图 9-28 中 是 nn = 4), 
有 2 个 B 和 2n-2 个 G 的 2n 个 字母 有 和 多少 种 组 合 ? (Cf) 在 (e) 部 分 中 ， 有 和 多少 种 组 合 会 导致 01 
级 或 10 级 系统 失效 ?( g) 如 果 有 两 个 磁盘 故障 ， 根据 Cf) 部 分 ， 确定 01 级 和 10 级 RAID 能 够 正 
常 工 作 的 概率 。(h) 根据 (g) 部 分 ,说明 图 9-28 中 RAID 磁盘 失效 的 概率 ， 在 两 个 磁盘 故障 的 情 
况 下 ， 对 01 级 来 说 是 4/7，10 级 是 1/7。 / 

19. 有 一 个 RAID 4 级 系统 、 八 个 数据 盘 和 一 个 奇偶 盘 。(a) 如 果 不 使 用 旧 数 据 和 旧 奇 偶 值 ， 写 一 个 数 
据 条 市 需要 多 少 磁盘 读 和 磁盘 写 ?(b) 如 果 使 用 旧 数 据 和 旧 奇 偶 值 ， 写 一 个 数据 条 带 需 要 多 少 磁 

盘 读 和 磁盘 写 ? 
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我 们 终于 要 讲 到 典型 计算 机 系统 的 最 底层 了 。 每 个 抽象 层 都 隐藏 了 上 一 层 用 户 不 需要 的 
4A, LGI 层 的 细节 对 ISA3 层 ， 即 指令 集 架 构 层 的 用 户 来 说 是 隐藏 的 。 要 记 住 ISA3 层 用 
户 看 到 的 是 使 用 机 器 语言 的 汉 … 诺 依 曼 机 器 ，LG1 层 设计 者 的 工作 是 构建 ISA3 层 机 器 。 最 
后 三 章 讲述 LG1 层 语 言 和 设计 原理 ,这些 内 容 对 于 构建 汉 : 诺 依 曼 机 器 是 必需 的 。 

本 书 中 的 图 都 会 有 指令 集 架 构 层 和 逻辑 门 层 之 间 的 微 代 码 层 。 一 些 设 计 者 在 机 需 中 选择 
省 略微 代码 层 而 直接 从 LGI 层 构 建 ISA3 层 机 器 ， 还 有 一 些 设计 者 则 选择 使 用 微 代 码 层 。 

这 两 种 设计 方法 的 优点 和 缺点 是 什么 呢 ? 答案 和 我 们 在 第 7、 第 6 和 第 $ 层 遇 到 的 一 
样 。 假 定 需要 给 App7 层 的 用 户 设计 一 个 应 用 程序 ， 你 是 愿意 用 HOL6 层 的 C++ 来 编写 ， 
然后 把 它 编译 到 较 低 的 层 上 ， 还 是 愿意 直接 用 Asmb5 层 的 Pep/8 汇编 语言 来 编写 呢 ? 因为 
C++ 在 较 高 的 抽象 层级 ， 一 条 C++ 语句 能 做 多 条 Pep/8 语句 的 工作 ， 所 以 C++ 程序 要 比 等 
效 的 Pep/8 程序 短 很 多 ， 因 此 也 更 容易 设计 和 调试 。 但 是 需要 用 编译 胡 把 C++ 程序 转换 到 
较 低 的 层级 ， 而 且 优 秀 的 汇编 语言 程序 员 通 常 能 生成 甚至 比 优化 编译 器 产生 的 目标 代码 还 要 
简短 和 快速 的 代码 。 汇 编程 序 可 以 执行 得 更 快 ， 但 是 很 难 设计 和 调试 ， 因 此 开发 成 本 高 昂 。 

在 第 7、 第 6 和 第 5 层 要 权衡 的 是 开发 成 本 和 执行 速度 ， 在 第 3、 第 2 和 第 1 层 也 是 一 
Eo i, ATG Me 层 的 系统 要 比 省 略 它 的 系统 简单 并 且 成 本 更 低 ,， 但 是 它们 通常 比 直接 
从 LG] 层 构建 的 系统 执行 得 更 慢 。 最 近 的 设计 趋势 是 用 小 指令 集 构建 简单 但 快速 的 汉 … 庄 
依 曼 机 器 ， 称 为 精简 指令 集 计 算 机 (Reduced Instruction Set Computer, RISC). RISC 机 器 
的 一 个 重要 特性 就 是 它 省 略 了 Mc2 Je. 

逻辑 门 层 下 有 两 个 层级 是 很 有 趣 的 ， 如 图 10-1 所 示 ， 但 在 本 
书 中 不 做 描述 。 在 电子 设备 层 (第 0 层 ),， 设计 者 连接 晶体 管 、 电 
阻 和 电容 形成 LG1 层 的 逻辑 门 。 在 物理 层 (第 -1 层 )， 应 用 物理 
学 家 构建 电子 工程 师 构成 门 电 路 所 需 的 晶体 管 ， 而 计算 机 设计 师 
用 门 来 构建 汉 ，: 诺 依 曼 机 器 。 物 理 层 下 没有 别 的 层级 ， 它 是 所 有 
科学 的 基础 。 

第 0 和 第 -1 层 的 语言 是 一 组 数学 公式 ， 对 本 层 的 对 象 行为 
建 模 。 你 也 许 熟 悉 其 中 的 一 些 。 第 0 层 包 括 欧 姆 定律 (Ohms 
law), FEAR EK EE ( Kirchoff’s rule) 以 及 电子 设备 的 电压 电 ae 
流 特 性 。 第 -1 层 包 括 库 仑 定律 (Coulomb's law), 4 ti x E Ot el et Pie 
(Newton’s law) 和 一 些 量子 力学 定律 。 在 所 有 层级 上 ， 从 App7 层 的 关系 数据 库 计 算 到 -1 
层 的 牛顿 定律 ， 形 式 化 数学 都 是 对 系统 行为 建 模 的 工具 。 


10.1 布尔 代数 和 逻辑 门 


电路 〈circuit) 是 物理 上 由 线路 连接 起 来 的 设备 集合 。LG1 层 电路 有 两 种 基本 类 型 : 组 
合 电路 和 时 序 电 路 。 可 以 把 任 一 种 电路 类 型 表示 成 一 个 叫 作 黑 盒 (black box) 的 长 方块 ， 有 
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固定 数量 的 输入 线 和 输出 线 。 图 10-2 展示 了 一 个 三 输入 二 输出 的 电路 。 
每 条 线路 携带 一 个 信号 ， 其 值 可 以 为 1 或 0。 在 电子 学 上 ,信号 1 是 一 个 小 电压 ， 通 常 


大 约 是 SV， 信 号 0 是 0V。 电 路 被 设计 成 只 能 检测 和 产生 这 样 两 种 输入 输出 
二 元 值 。 a -> x 
可 以 把 图 10-2 看 成 一 种 说 明 输 入 - 处 理 - 输出 结构 的 方式 , 在 “一 ~ 
计算 机 系统 的 所 有 层级 都 能 看 到 。 电 路 执行 处 理 ， 把 输入 转换 为 
输出。 3 图 10-2 ”电路 的 黑 盒 表示 


10.1.1 组 合 电路 


对 于 组 合 电 路 (combinational circuit)， 输 入 决定 输出 。 例 如 在 图 10-2 中 ， 如 果 今 天 输 
和 是 a=1, b=0, c=1 (缩写 为 abc = 101)， 得 到 输出 wy = 01 ; 明天 输入 是 apc = 101, 
还 是 得 到 输出 xy = 01。 在 数学 上 ,x A y 是 cb 和 ec HPAL, Bl x = x(a, b,c) My = y(a, b,c). 

时 序 电路 则 不 然 。 如 果 对 时 序 电路 输入 abe = 101， 可 能 有 时 会 得 到 xy = 01， 但 是 几 
微 秒 后 得 到 xy = 11。 第 11 章 会 解释 这 种 看 上 去 没有 什么 意义 的 行为 是 怎样 发 生 的 ， 以 及 对 
于 构建 计算 机 而 言 这 种 行为 为 什么 是 不 可 或 缺 的 。 

描述 组 合 电 路 行为 的 三 种 最 通用 的 方法 是 : 

e HEK; | 

e 布尔 代数 表达 式 ; 

e 逻辑 图 。 

本 节 剩 余部 分 将 描述 这 些 表 达 方 法 。 


10.1.2 HÉR 


表达 组 合 电路 的 三 种 方法 中 ， 真 值 表 要 比 代 数 表达 式 和 逻辑 图 的 抽象 层次 更 高 。 真 值 表 
说 明 组 合 电路 做 什么 ， 而 不 是 说 明 怎 样 做 。 真 值 表 只 是 列 出 输入 值 每 种 可 能 组 合 的 输出 〈 这 
就 是 组 合 电路 名 称 的 由 来 )。 

Hj 10.1 图 10-3 是 一 个 三 输入 二 输出 组 合 电路 的 真 值 表 。 因 为 有 3 个 输入 ， 每 个 输入 
有 两 种 可 能 的 值 ， 因 此 这 个 表 有 2 =8 个 条 目 。 通 常情 况 下 , n 输入 组 合 电 路 的 真 值 表 有 2” 


例 10.2 图 10-4 是 男 一 个 由 真 值 表 说 明 组 合 电 路 的 例子 ， 它 是 一 个 四 输入 的 电路 ， 其 
真 值 表 中 有 16 个 条 目 。 口 
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图 10-3 一 个 三 输入 二 输出 的 组 合 电 路 图 10-4 一 个 四 输入 二 输出 的 组 合 电路 
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先 规则 ， 分 配 律 变 成 
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图 10-2 的 黑 盒 图 尤其 适合 组 合 电路 的 真 值 表 表 达 。 人 们 看 不 到 涂 黑 的 盒子 里 面 是 什么 
样 的 ， 同 样 也 看 不 到 电路 怎样 生成 真 值 表 定 义 的 函数 。 


10.1.3 布尔 代数 


根据 布尔 代数 定律 写 出 的 代数 表达 式 不 仅 说 明 组 合 电 路 做 什么 ， 而 且说 明 它 是 怎样 做 
的 。 布 尔 代数 在 某 些 方面 类 似 于 我 们 熟悉 的 实数 代数 ， 但 是 在 其 他 方面 是 不 一 样 的 。 实 数 代 
数 的 四 个 基本 运算 是 加 、 减 、 乘 、 除 ， 布 尔 代 数 的 三 个 基本 运算 是 OR (符号 为 “+” 小 
AND (符号 为 “.”) 和 “ 求 补 ”( 符 号 为 “”)。AND 和 OR 是 二 元 运算 ， 求 补 是 一 元 
运算 。 


布尔 代数 的 10 个 基本 属性 是 


ery = yr x ey ae =z 交换 律 
(xt+y)+z=x+(y+tz) (x: y)*z=x°(y°Z) 结合 和 
x+(yoz)=(ty) (+z) x* (y+2)= (x°*y) +(x* 2) 分 配 律 
x+0 =x x-l=x 恒 等 律 
x+(x’ )= 1 xr. (x )=0 互补 律 


其 中 , x、y 和 z 是 布尔 变量 。 和 实数 代数 一 样 ， 表 达 式 中 插入 
圆 括号 表示 哪些 运算 要 先 执 行 。 为 了 简化 ， 避 人 免 表 达 式 中 出 现 
过 多 括号 ， 布 尔 运算 有 如 图 10-5 所 示 的 优先 结构 。 使 用 这 种 优 





x+y z= (x+y) (x+2) x e (y +z) =5x*y+x’y 
互补 律 变 成 图 10-5 布尔 运算 符 的 优先 级 
x+x =|] xex 三 0 
实数 代数 和 布尔 代数 属性 之 间 的 一 个 显著 不 同 是 分 配 律 。 对 于 实数 ， 乘 法 在 加 法 上 有 分 
配 律 ， 例 如 
2°(3+4)=2°3+2°4 
但 是 加 法 在 乘法 上 没有 分 配 律 ， 例 如 
2+3°4=(2+3)°(2+4) 
是 不 成 立 的 。 然 而 在 布尔 代数 中 ,“+” 代 表 OR,“， ”代表 AND，OR 在 AND 上 没有 分 配 律 。 
布尔 代数 的 定律 有 实数 代数 没有 的 对 称 性 ， 每 个 布尔 属性 都 有 对 偶 性 (dual property). 
做 如 下 操作 
o 交换 “+” 和 “…” 
© 交换 1 和 0 
就 能 得 到 对 偶 的 表达 式 。 分 配 律 的 两 种 形式 就 是 对 偶 表 达 式 的 一 个 例子 。 在 分 配 律 
ttz) = (+ y) * @ +2) 
中 ， 如 果 交 换 “+” 和 “ ”运算 符 ， 就 会 得 到 
x° (y+2) = (x+y) + (x ° 2) 
这 是 另 一 个 分 配 律 表 达 式 。 布 尔 代 数 的 每 个 基本 属性 都 有 相应 的 对 偶 性 。 
结合 律 也 使 得 表达 式 可 以 进一步 简化 。 因 为 执行 两 个 OR 运算 的 顺序 是 不 重要 的 ， 你 可 
以 把 


二 
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写成 没有 括号 的 
ae i | ae a 


这 也 适用 于 AND 运算 。 
10.1.4 布尔 代数 定理 


因为 布尔 代数 和 我 们 熟悉 的 实数 代数 有 不 同 的 数学 结构 ， 所 以 布尔 代数 的 定理 初 看 之 下 
可 能 显得 很 特殊 。 接 下 来 要 讨论 从 布尔 代数 的 10 个 基本 属性 证 明 出 来 的 定理 ， 它 们 在 组 合 
电路 的 分 析 和 设计 中 非常 有 用 。 
Ft (idempotent property) 表明 
x+x=x 
证 明 这 个 定理 需要 一 系列 的 替换 步骤 ， 每 一 步 都 基于 布尔 代数 的 10 个 基本 属性 之 一 : 
irk 
= ”< 恒 等 律 > 
(x+x)* I 
= ”< 互补 律 > 
(大 二 区 
= ”< 分 配 律 > 
+ Gs x 
= < 互补 律 > 
x+0 
= < 恒 等 律 > 
x 
对 偶 性 为 
x°x=x 
对 偶 定 理 的 证 明和 上 述 步骤 完全 一 样 ， 每 个 替换 都 基于 原 证 明 中 对 应 步骤 的 对 偶 属 性 : 
ae : 
= < 恒 等 律 > 
EE 
= < 互补 律 > 
(x-x)+(x°x’ ) 
= < 分 配 律 > 
tet 3 
= < 互补 律 > 
s] 
= < 恒 等 律 > 
x 
re 5 HE Jon AY WE BA eas T ARRE PIR EAER MH —Bik SEH, Ap 
么 就 可 以 立即 断言 它 的 对 偶 定 律 也 一 定 成 立 。 因 为 10 个 基本 属性 中 的 每 一 个 都 有 对 偶 属 
性 ， 所 以 对 应 的 证 明 在 结构 上 和 原 证 明 是 相同 的 ， 只 不 过 每 一 步 都 基于 原始 步骤 的 对 偶 
属性 。 
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这 里 有 三 个 更 有 用 的 定理 及 它们 的 对 偶 定 理 。 证 明定 理 的 数学 规则 是 可 以 在 证 明 中 使 
用 任何 公理 或 以 前 已 经 证 明了 的 定理 。 要 证 明 下 面 第 一 个 定理 ， 可 以 使 用 任何 基本 属性 和 用 
等 性 。 要 证 明 第 二 个 定理 ， 可 以 使 用 任何 基本 属性 、 客 等 性 和 已 经 证 明了 的 第 一 个 定理 ， 等 
等 。 第 一 个 定理 


x+1=1 | x°0=0 
称 作 零 元 定理 。0 是 AND 运算 符 的 零 元 ，1 是 OR 运算 符 的 零 元 。 第 二 个 定理 
x+x*y=x x°-(xt+y)=x 


叫 作 吸收 律 ， 因 为 被 吸收 到 x 中 。 第 三 条 和 定理 
Xi yptx + ety z—xi pr’ *zZ (x+y) * (x'+ 2) * (vyt+z) = @+y)* atz) 


叫 作 合意 (consensus) 定理 。 这 几 个 定理 的 证 明 作 为 章 末 练习 。 
10.1.5 互补 证 明 


x 的 补 是 x'。 要 证 明 表 达 式 y 是 表达 式 z 的 补 ， 必 须 证 明 y 和 z 遵循 同样 的 互补 属性 ， 
就 像 x 和 x' 一样， 即 
ytz=1 y*z=0 
互补 证 明 的 一 个 例子 是 德 . 摩根 定律 (De Morgan’s law), CRH 
(a + b)'=a’+b' | 
要 证 明 a: b 的 补 是 w+ b', WAVE 
(a*b)+(a+b')=1 (a:b): (a'+ b) = 0 
这 个 证 明 的 第 一 部 分 如 下 
(a * b) + (a'+ b’) 
= “< 交换 律 > 
(a't b+ (a+b) 
= < 分 配 律 > 
Ka't 0 + a] + [(a'+ b’) + 5] 
= “< 交换 律 和 结合 律 > 
[bt (a+ a’)] * [a (D +D] 
= < 互补 律 > 
EF TI [aF T] 
< 零 元 定理 , x+ 1 三 1> 
ER 
< ØF, (x :1 = Dix = 1]> 
1 
证 明 的 第 二 部 分 如 下 
(a = b) + (a'+ b’ 
= < 分 配 律 > 
(a:b): a'+ (a ° b) ° b'. 
= < 交换 律 和 结合 律 > 
b:(a:a')+a:(b: dD’) 
= < 互补 律 > 
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b*0+a*0 
= “< 零 元 定理 ,，x * 0 = 0> 
0+0 
= < 和 恒 等 律 ，(x + 0 = x)[x := 0]> 
0 
fa - 摩根 第 二 定律 
(a+b)=a’.b’ 
直接 从 对 偶 性 得 出 。 
fa- 摩根 定律 可 推广 到 多 个 变量 的 情况 。 对 于 3 个 变量 ， 该 定律 是 
(a*b*c)=atb'te (at+b+c)=a’.b':c' 


多 于 两 个 变量 的 一 般 性 定理 的 证 明 作 为 章 末 练习 。 
男 一 个 互补 定理 是 (x”)'=x, x 的 补 是 x， 因 为 x+x 三 1， 其 证 明 如 下 
, Z+ 
< 交换 律 > 
Xxx 
< 互补 律 > 
1 
以 及 xx 一 0， 其 证明 如 下 
> sl S 
= “< 交换 律 > 
¥ +x 
= <EM> 
0 
男 一 个 互补 定理 是 1'=0,，1 EOWA, 因为 1+0 = 二 1， 其 证 明 如 下 
1+0 i 
= ”< 和 恒 等 律 ，(x +0 = x) [x := 1]> 
] 
以 及 1* 0 = 0， 其 证 明 如 下 


1.0 
= ”< 交换 律 > 
0-1 
= ”< 人 和 恒 等 律 (x: 1 = x) [x := 0]> 
0 
可 以 直接 得 出 对 偶 定 理 0'= 1。 
10.1.6 ”逻辑 图 


组 合 电路 的 第 三 种 表示 方法 是 逻辑 门 的 互联 。 因 为 逻辑 图 中 连接 门 的 线路 表示 连接 电路 
板 或 集成 电路 上 物理 设备 的 物理 线路 ， 所 以 这 种 表现 形式 最 接近 于 硬件 。 

每 个 布尔 运算 由 一 个 门 符号 来 表示 ， 如 图 10-6 所 示 。AND 和 OR 门 有 两 条 输入 线 ， 标 
WA ab; 反 相 器 只 有 一 条 输入 线 ， 输出 是 x， 这 对 应 于 求 补 是 一 元 运算 的 事实 。 图 中 也 
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展示 出 了 每 个 门 对 应 的 布尔 表达 式 和 真 值 表 。 


a a 

x x 
b b 
x=a:b 


x=a+b 





a) AND 门 b) OR 门 c) AHA 
497 图 10-6 三 类 基本 的 逻辑 门 


任何 布尔 函数 都 能 只 用 AND 、OR 和 求 补 运算 写 出 来 ， 并 由 此 构建 任何 组 合 电路 ， 只 需 
图 10-6 中 的 三 个 基本 门 。 实 际 中 还 有 几 个 其 他 常用 的 门 ， 图 10-7 给 出 了 其 中 的 三 个 。 





a) NAND 门 b) NOR 门 c)XOR 门 


图 10-7 三 类 篆 见 的 逻辑 门 
NAND (Not AND, 与 非 ) 门 等 价 于 AND [Ja i—7 AAAs, OO 10-8 所 示 。 类 似 地 ， 


NOR (Not OR， 与 或 ) 门 等 价 于 OR 门 后 跟 a a 
ARH EUTZE, HE NANDE ， J He: A J J 
往 比 构建 AND 门 容 易 。 实 际 上 经 常用 NAND 
门 后 跟 反 相 器 来 构建 AND 门 。NOR 门 也 要 We — 
比 OR 门 更 常用 。 图 10-8 ”两 个 等 价 的 组 合 电 路 
XOR (exclusive OR) 表示 异 或 ， 而 OR 有 时 称 为 包含 或 (inclusive OR)。 如 果 任 一 输入 
或 者 两 个 输入 都 为 1， 那 么 OR 门 的 输出 为 1。 如果 只 有 一 个 输入 为 1， 那么 XOR 门 的 输出 
为 1 ; 如 果 两 个 输入 都 是 1， ABA XOR 门 输出 为 0。XOR 运算 的 代数 符号 是 由 ，& 外 b 的 代 
数 定 义 是 
aWb=a:b'+a':b 
XOR 运算 符 的 优先 级 高 于 OR 但 是 低 于 AND ， 如 图 10-9 所 示 。 
例 10.3 AR 
a+b@c:d 
完全 加 上 括号 得 到 a + (bO(c:d)). RH XOR 的 定义 展开 
后 ， 表 达 式 变 为 图 10-9 XOR 运算 符 的 优先 级 
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a+b:+(c:d)'+b'+(c:d) 口 

也 可 以 使 AND 和 OR 有 2 个 以 上 的 输入 。 图 10-10 展 
示 了 一 个 三 输入 AND 门 和 它 的 真 值 表 。 只 有 当 所 有 输入 
均 为 1 时 ，AND 门 的 输出 才 为 1。 只 有 当 所 有 输入 均 为 0 
时 ，OR 门 的 输出 才 是 0。 


10.1.7 ”其 他 表达 方式 


你 可 能 已 经 看 出 AND 门 、OR 门 和 反 相 器 与 C++ 布 
尔 表达 中 AND, OR 和 NOT 运算 的 相似 性 。 它 们 的 真 值 。 区 1010 三 输入 的 AND 门 
表 是 一 样 的 ，NOT 对 应 反 相 器 ，C++ 的 真 值 和 假 值 分 别 对 应 布尔 代数 的 1 和 0。 

布尔 代数 的 数学 结构 非常 重要 ， 因 为 它 不 仅 适 用 于 组 合 电路 ， 而 且 也 适用 于 语句 逻辑 。 
C++ 用 语句 逻辑 来 确定 包含 在 if 和 循环 语句 中 的 条 件 的 真 假 。 人 工 智能 中 最 近 一 组 很 重要 
的 编程 语言 甚至 更 加 广泛 地 使 用 了 语句 逻辑 ， 用 这 些 语言 编写 的 程序 通过 一 种 称 为 逻辑 编程 
(logic programming) 的 技术 来 模拟 人 的 推理 。 布 尔 代 数 是 这 个 领域 的 主要 组 成 部 分 。 

布尔 代数 的 另 一 种 表示 方式 是 使 用 集合 运算 。 如 果 把 一 个 布尔 变量 看 作 一 个 集合 ，OR Ki 
运算 看 作 集 合 的 并 ，AND 运算 看 作 集合 的 交 ， 求 补 运算 看 作 集 合 的 补 ，0 看 作 空 集 ，1 看 作 4 
全 集 ， 那 么 所 有 布尔 代数 的 性 质 和 定理 也 适用 于 集合 。 

fil 10.4 定理 

x+1=1 
说 明 全 集 和 任何 其 他 集合 的 并 集 是 全 集 。 口 

例 10.5 图 10-11 展示 的 是 用 集合 论 的 文 氏 图 (Venn diagram) 来 解释 吸收 律 

KEK PHS 
图 10-11a 给 出 的 是 集合 x， 图 10-11b 是 x My 的 交集 ， 也 就 是 既 在 x 又 在 > 中 的 所 有 元 素 
的 集合 。 这 个 集合 和 x 的 并 集 如 图 10-11c 所 示 。 可 以 看 到 图 10-11a 中 的 区 域 和 图 10-11c 中 
的 区 域 是 相同 的 ， 这 说 明了 吸收 律 。 口 


a) x b)x-y GJETE ý 
图 10-11 吸收 律 的 集合 论 诠 释 
以 布尔 代数 来 解释 组 合 电 路 的 描述 ， 以 及 它 作 为 语句 逻辑 的 基础 ， 表 明 它 是 计算 机 科 


学 中 大 部 分 理论 和 应 用 的 数学 基础 。 它 还 能 描述 集合 论 ， 也 表明 了 它 在 其 他 数学 领域 里 的 重 
要 性 。 


10.2 组 合 分 析 


每 个 布尔 表达 式 有 一 个 对 应 的 逻辑 图 ， 每 个 逻辑 图 有 一 个 对 应 的 布尔 表达 式 。 用 数学 术 
语 来 说 ， 两 者 之 间 是 一 一 对 应 的 关系 。 然 而 ， 给 定 一 个 真 值 表 会 有 几 种 不 同 的 实现 方式 。 
图 10-12 展示 了 一 个 真 值 表 ， 有 有 几 个 对 应 的 布尔 表达 式 和 你 辑 图 。 500 
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图 10-12 一 个 给 定 的 真 值 表 可 以 有 多 种 实现 
本 节 讲 述 组 合 电 路 三 种 表达 方式 之 间 的 对 应 关系 。 
10.2.1 布尔 表达 式 和 逻辑 图 


布尔 表达 式 由 用 AND 、OR 和 反 相 运算 组 合 在 一 起 的 一 个 或 多 个 变量 组 成 。 电 路 输入 的 
数量 等 于 变量 的 数量 。 本 节 和 下 节 都 专注 于 单 输出 电路 ， 本 章 最 后 一 节 会 涉及 多 于 一 个 输出 
的 电路 。 

画 出 给 定 布尔 表达 式 的 逻辑 图 ， 就 是 给 每 个 AND 运算 画 AND 门 ， 给 每 个 OR 运算 画 
OR 门 ， 给 每 个 求 补 运算 画 反 相 门 。 根 据 表达 式 将 一 个 门 的 输出 连接 到 男 一 个 门 的 输入 。 该 
组 合 电 路 的 输出 是 某 一 个 门 的 输出 ， 这 个 门 


的 输出 没有 连接 到 另 一 个 门 的 输入 。 wales 

10.6 图 10-13 展示 了 对 应 布尔 表达 be / 

式 a+ bc 的 逻辑 图 。 从 现在 开始 ,我 们 将 忽 “ 

略 AND 运算 的 符号 ， 把 这 个 布尔 表达 式 写成 SS ie ae ee 
a+ b'c 

在 每 个 门 的 输出 上 标 出 它 对 应 的 表达 式 。 Oo 


当 表 达 式 有 括号 时 ， 必 须 首 先 构 建 括号 内 的 子 图 。 

例 10.7 图 10-14 是 三 变量 表达 式 

((ab + bc’) a)’ 
的 逻辑 图 ， 首 先 用 一 个 AND 门 形成 abp， 用 男 一 个 AND 门 形成 gc'， 这 两 个 门 的 输出 进行 OR 
运算 ， 然 后 和 a 进行 AND 运算 。 因 为 要 对 整个 表达 式 求 补 ， 因 此 反 相 器 是 最 后 的 门 。 口 





((ab+bc')a)' 


图 10-14 布尔 表达 式 ((abt+be')a)' 的 逻辑 图 


图 10-14 中 的 两 个 小 黑 点 是 结合 点 ， 在 结合 点 处 两 条 线路 物理 上 是 相连 接 的 。 回 想 一 
下 ， 变 量 a 提供 的 物理 信号 是 电压 ， 当 输入 a 来 的 信号 到 达 结 合 点 时 ， 它 不 像 河 里 的 水 在 河 
道里 遇 到 分 叉 那 样 ， 一 些 水 分 叉 流 到 一 条 路 径 上 ， 另 一 些 水 分 叉 流 到 另 一 条 路 径 上 。 在 逻辑 
图 中 ， 不 存在 一 部 分 信号 去 一 个 AND 门 的 输入 ， 另 一 部 分 信号 去 另 一 个 AND 门 的 输入 这 
种 情况 ， 从 a 来 的 信号 完全 复制 到 两 个 门 的 输入 上 。 

对 于 具有 一 定 物理 知识 的 人 来 说 ， 产 生 这 种 现象 的 原因 是 电压 是 电势 的 度量 。 导 线 的 电 
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阻 很 低 ， 根 据 欧 姆 定律 ， 这 意味 着 在 导线 上 的 电势 改变 可 以 忽略 不 计 ， 所 以 沿 着 任何 物理 上 
连接 的 线路 ， 电 压 是 恒定 不 变 的 。 因 此 不 管 有 没有 结合 点 ， 电 压 信 和 号 在 任何 点 都 是 一 样 的 。 
(对 不 懂 物 理 知识 的 人 来 说 ， 这 可 能 是 一 个 学 习 的 动机 ! ) 


任何 来 自 变 量 的 信号 都 能 利用 结合 点 进行 复制 。 任 何 变量 的 补 都 能 用 反 相 器 生成 ， 变 


量 的 补 同 样 也 能 通过 结合 点 复制 。 在 逻辑 图 中 经 常 忽略 不 显示 变量 复制 的 结合 点 和 变量 反 相 
器 。 也 就 是 可 以 假设 任何 变量 和 它 的 补 都 可 以 作为 任何 门 的 输入 。 
例 10.8 图 10-15 是 图 10-14 利用 这 个 假设 后 的 简略 版 ， 它 也 认可 AND 门 后 面 跟 反 相 
器 等 同 于 NAND 门 。 口 
这 个 简略 图 的 缺点 是 ， 此 网 络 实际 上 有 三 输入 这 种 情形 ， 但 没有 图 10-14 中 表现 得 明显 。 
例 10.9 图 10-16 展示 的 是 四 输入 布尔 表达 式 
(a'bc 中 c+a+dgd)， 
的 逻辑 图 。 要 注意 异 或 运算 符 的 优先 级 低 于 AND ， 但 是 高 于 OR。 口 


a a 

b a’ a 

b b d 
Cc 

Cc’ G 


图 10-15 图 10-14 的 简化 版 本 图 10-16 布尔 表达 式 (a'bc 由 c+a+d)' 的 逻辑 图 


要 根据 给 定 的 逻辑 图 写 出 布尔 表达 式 ， 就 是 简单 地 把 每 个 门 的 输出 用 适当 的 子 表达 式 标 
识 出 来 。 如 果 没 有 给 布尔 表达 式 而 是 给 了 图 10-16 的 逻辑 图 ,那么 应 该 从 用 a'bc 标识 AND 
门 的 输出 做 起 。 XOR 门 的 输出 应 该 标识 为 a'bc 由 c， 它 通过 NOR 门生 成 完整 的 布尔 表达 式 。 


10.2.2 ” 真 值 表 和 布尔 表达 式 


根据 真 值 表 生成 布尔 表达 式 的 一 种 方法 是 把 没有 括号 的 表达 式 写 成 几 个 AND 项 的 OR, 
每 个 AND 项 对 应 真 值 表 中 的 一 个 1。 

例 10.10 a 名。b 的 真 值 表 有 两 个 1， 对 应 的 布尔 表达 式 是 

a@® b= a'b+ab' 
如 果 a 为 0、b 为 1， 那么 第 一 个 AND 项 将 会 是 1 ; 如 果 a 为 1、b 为 0， 那 么 第 二 个 AND 
项 将 会 是 1。 不 论 哪 种 情况 ， 这 两 项 的 OR 将 会 是 1。 此 外 ,任何 其 他 a 值 和 4b 值 的 组 合 将 


使 这 两 个 AND 项 都 为 0， 所 以 布尔 表达 式 为 0。 口 
i) 10.11 图 10-3 显示 当 abc = 001 Fil abe = 011 时 , x 为 1; abc 为 其 他 组 合 时 ,x 为 0。 
对 应 的 布尔 表达 式 为 


x = a'b'c + a'bc 
当 且 仅 当 apc = 001 时 ,第 一 个 AND 项 a'b'c 为 1!， 当 且 仅 当 abc = 011 时， 第 二 个 AND 
项 为 1， 除了 这 两 个 条 件 以 外 ， 这 两 项 的 OR 都 将 为 0， 和 真 值 表 一 样 。 LJ 
例 10.12 10-4 Px 的 真 值 表 是 四 个 变量 的 例子 ， 对 应 的 表达 式 为 
x = a'bc'd + a'bcd + abc'd + abcd 
有 4 种 a、b、c 和 4 的 组 合 会 得 出 真 值 表 里 的 1。 口 
对 偶 技术 能 够 把 表达 式 写 成 几 个 OR MA AND, HA OR 项 对 应 真 值 表 中 的 0。 
例 10.13 图 10-17 的 表达 式 是 


x = (a+ b'+ c')(a'+ b'+ e) 
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如 果 abc = 011， 那 么 第 一 个 OR 项 为 0 ; 如 果 abe = 110， 那 么 第 二 个 OR 项 为 0。 满足 这 
两 个 条 件 中 的 任意 一 个 ，OR 项 的 AND 就 为 0。abc 的 所 有 其 他 组 
合 会 使 两 个 OR 项 为 1， 表 达 式 的 值 为 1。 口 一 二 和 
给 定 一 个 布尔 表达 式 ， 构 建 对 应 真 值 表 最 直接 的 方式 是 ,计算 | oj|o 11 
出 变量 所 有 可 能 组 合 的 表达 式 的 值 。 
例 10.14 构建 
x (a, b) = (a ® b)'+ a’ 
的 真 值 表 需要 计算 
x (0, 0) = (0 @ 0)'+ 0= 1 
x (0,1) =(0@ 1)'+ 0= 1 
x (1,0) = (1 @ 0)'+ 1'=0 
x(1,1l)=(1@1)'+1=1 
这 个 例子 需要 计算 两 个 变量 a Fl b 的 四 种 可 能 组 合 的 值 。 口 
如 果 表 达 式 包含 多 于 两 个 变量 ， 有 时 候 利 用 布尔 代数 的 属性 和 定理 把 布尔 表达 式 转 换 成 
几 个 AND 项 的 OR 要 更 容易 些 ， 由 此 可 以 写 出 真 值 表 。 
例 10.15 图 10-16 的 表达 式 简化 为 
(a'bc O®ct+at+d)' 
二 ”< 外 的 定义 > 
(人 
= 《互补 律 ，cc'= 0; 零 元 定理 , x-0=0) 
((a'bc)'c+a+d)' 
= (W. 摩根 定律 》 
(fa + O'+ cje+a+ dy’ 
= 《分 配 律 、 互 补 律 和 恒 等 律 》 
(ac + b’c +a+d)’ 
= (RW, at+ac=a) 
(a+ bet ady 
《 德 . 摩根 定律 》 
a'(b'c)'d' 
= (78 - EREE) 
a'b + cd" 
= 《分 配 律 ， 
a'bd'+ a'c'd' 
真 值 表 有 16, MARIAH, TE abd = 
010 (两 项 ) Al acd = 000 (两 项 ) 的 地 方 插 
入 1， 所 有 其 他 项 是 0， 结 果 如 图 10-18 所 
示 。 由 于 abd = 010 的 其 中 一 项 也 满足 acd = 
000， 因 此 有 3 个 1 而 不 是 4 个 。 


这 项 技术 避免 了 计算 原始 表达 式 16 次 。[ | 1 tte 丁丁 西西 四 


实际 上 这 个 任务 可 能 没有 刚 开 始 看 上 去 那么 图 10-18 图 10-16 中 表达 式 的 真 值 表 





图 10-17 三 变量 真 值 表 
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困难 。 只 要 稍微 想 一 下 ， 就 能 根据 4 为 1 时 的 原始 表达 式 推 论 出 不 管 a、b 和 c 的 值 是 什么 ， 
括号 内 的 表达 式 一 定 是 1， 它 的 反 一 定 是 0。 类 似 情 况 ， 当 a 为 1 时 表达 式 一 定 为 0。 这 样 
就 只 剩 下 ad = 00 的 四 种 情况 了 。 口 


10.2.3 ”两 级 电路 


每 个 布尔 表达 式 都 可 以 转换 成 AND-OR 表达 式 ， 这 一 事实 对 组 合 电 路 的 处 理 速 度 有 重 
要 的 实际 影响 。 当 改变 门 的 一 个 输入 信号 时 ， 输 出 不 会 马上 做 出 响应 。 信 和 号 会 通过 门 的 内 部 
电子 元 件 ， 存 在 时 间 上 的 延迟 。 门 输出 对 输入 改变 做 出 响应 要 花费 的 时 间 称 作 门 延迟 (gate 
delay) 。 和 采用 不 同 制造 工艺 的 门 具 有 不 同 的 门 延 迟 。 制 造 延 迟 短 的 门 要 更 贵 一 些 ， 这 种 门 比 
延迟 长 的 门 需要 更 多 的 电能 来 运行 。 虽 然 不 同 设备 技术 导致 门 延 迟 差 异 很 大 , 但 典型 的 门 延 
述 是 2ns (nanosecond, AF). 

十 亿 分 之 二 秒 对 于 等 待 输出 好 像 不 是 一 段 很 长 的 时 间 ， 但 是 如 果 一 个 电路 有 一 长 串 的 
门 ， 必 须 循 环 进行 处 理 ， 那 么 这 段 时 间 就 有 可 能 很 长 了 。 信 号 以 近似 3.0X 10*mys 的 光速 通 
过 线路 ， 也 就 是 Ins 通过 30cm。 典 型 门 延 迟 2ns 内 ， 信 和 号 能 通过 60cm 的 线路 。 相 比 于 集成 
电路 或 电路 板 的 尺寸 ， 这 是 相当 长 的 距离 ， 所 以 实际 上 门 延迟 决定 了 网 络 处 理 速 度 。 

例 10.16 思考 图 10-16 的 电路 ， 如 果 门 延迟 是 2ns, b 的 一 个 变化 传 过 AND 门 需要 
2ns， 传 过 XOR 门 需 要 2ns， 传 过 NOR 门 需 要 2ns， 即 需要 6ns 的 传输 时 间 (忽略 经 过 反 相 
人 锅 的 传输 延迟 ) 。 

现在 考虑 用 布尔 代数 把 这 个 电路 写成 AND-OR 形式 的 表达 式 : 

x= (abc 由 c+a+d) 


= a'bd'+a'c'd' 
图 10-19 展示 的 是 相应 的 电路 。 因 为 输入 的 改变 只 需要 2 个 门 延 迟 就 传送 到 输出 ， 因 此 叫 作 
两 级 电路 。 口 


将 处 理 时 间 从 6ns 缩短 到 4ns， 意 味 着 33% 的 速度 提升 ， 效 果 非 常 显著 。 因 为 任何 布尔 
表达 式 都 能 转换 成 AND-OR 表达 式 ， 而 AND-OR 表达 式 又 对 应 两 级 AND-OR 电路 ， 所 以 
任何 函数 都 可 以 用 最 多 有 两 个 门 延 迟 处 理 时 间 的 组 合 电路 来 实现 。 

同样 的 理论 也 适用 于 对 偶 原 则 。 总 是 可 以 把 布尔 表达 式 转 换 成 OR-AND 表达 式 ，OR- 
AND 表达 式 对 应 两 级 电路 ， 这 样 的 两 级 电路 最 多 有 两 个 门 延迟 的 处 理 时 间 。 要 得 到 布尔 表 
达 式 的 OR-AND 表达 式 ， 可 以 首先 得 到 AND-OR 表达 式 的 补 ， 然 后 使 用 德 ， 摩根 定律 即 可 。 

例 10.17 图 10-20 是 图 10-17 的 表达 式 

x= (a tD teya tote) 


的 两 级 OR-AND 电路 。 回 想 一 下 ， 每 个 OR 项 对 应 真 值 表 中 的 一 个 0。 口 


a’ . 
b 
d' 


N 


bh’ 
p 
a' o 
of b 
d' Cc 
图 10-19 等 价 于 图 10-16 中 电路 图 10-20 图 10-17 对 应 的 两 级 


的 两 级 AND-OR 电路 OR-AND 电路 
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例 10.18 图 10-13 的 表达 式 是 
x=a+b'c 
要 把 这 个 表达 式 转换 成 OR-AND 表达 式 ， 首 先 写 出 它 的 补 
X = (a + b'cy' 
= a'(b'c) 
= a'(b + c') 
= a'b + a'c' 
这 是 一 个 AND-OR 表达 式 。 再 使 用 德 ， 摩根 定律 把 x 写成 
x = (x) 
= (a’b+a'c')’ 
= (a'b)'(a'c')' 
= (a+ b'(a + c) 
这 就 是 一 个 OR-AND 表达 式 了 。 口 
通常 三 级 或 更 多 级 的 电路 比 等 价 的 两 级 电路 所 需 的 门 更 少 。 因 为 门 占用 集成 电路 的 
物理 空间 ， 所 以 尽管 两 级 电路 能 达到 更 快 的 处 理 速度 ， 但 代价 是 为 更 多 的 门 提供 额外 的 
空间 。 
这 也 是 计算 机 科学 中 一 个 空间 /时 间 折 中 的 例子 。 值 得 注意 的 是 从 高 抽象 层级 的 软件 到 
低 抽 象 层 级 的 硬件 ， 都 有 这 样 的 空间 / 时 间 问 题 ， 这 确实 是 一 个 基本 问题 。 


10.2.4 无 所 不 在 的 NAND 
表达 式 (abc) 表示 一 个 三 输入 NAND 门 ， 德 摩根 定律 表述 为 


(abc) =a'+b'+c' 
可 以 把 第 二 个 表达 式 想 象 成 一 个 OR 门 的 输出 ， 这 个 OR 门 在 执行 OR 运算 前 把 每 个 
输入 反 相 。 逻 辑 图 偶尔 把 NAND 门 画 成 反 相 输入 的 NOR， 如 


10-21a 所 示 。 b J > 
从 对 偶 表 达 式 得 出 a 


(a+b+c)'=a'b'c' 
NOR 门 等 价 于 反 相 输入 的 AND 门 ， 如 图 10-21b 所 示 。 
将 这 个 理念 进一步 运用 到 两 级 电路 。 考 虑 c 


abc + def = [(abc)'(def)']' 
的 等 价 表达 式 ， 这 也 可 以 从 德 . 摩根 定律 得 出 。 第 一 个 表达 式 
表示 一 个 两 级 AND-OR 电路 ， 而 第 二 个 表示 的 是 一 个 两 级 的 “> 
NAND-NAND 电路 。 图 10-22 展示 的 是 这 些 等 价 的 电路 。 c 
图 10-22a 展示 的 是 一 个 AND-OR 电路 ， 它 有 两 个 AND 

门 和 一 个 OR 门 。 也 可 以 完全 用 NAND 门生 成 等 价 电路 ， 如 

图 10-22b 所 示 。 除 了 最 后 的 NAND MMS RAMAN OR 之 本 六 
外 ， 图 10-22c 和 图 10-22b 是 一 样 的 。 这 种 画 法 可 以 明显 看 / 

出 AND 运算 后 面 的 求 补 和 OR 运算 前 面 的 求 补 抵消 了 ， 门 符 及 巾 输入 的 ANDIi] 作 为 NORI ] 


号 变 成 了 和 AND-OR 电路 中 类 似 的 形状 ， 这 有 助 于 表达 电路 。 ”图 10-21 等 价 的 门 
的 含义 。 
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a) 一 个 AND-OR 电 路 b) 等 价 的 NAND-NAND 电 路 c) 与 bj 相同 的 NAND-NAND 电 路 
图 10-22 一 个 AND-OR 电路 及 其 等 价 的 NAND-NAND 电路 


不 仅 可 以 用 NAND 门 来 完全 替换 任意 的 AND-OR 电路 ， 而 且 可 以 通过 把 NAND 输入 
连接 到 一 起 ， 由 NAND 门 得 到 反 相 器 ， 如 图 10-23 所 示 。 因 为 
NAND 用 输入 a 和 4b 生成 (ab)， 如 果 指 定 b = 二 a， 那么 门将 生成 
(a:a)'=a', Bla 的 补 。 


从 理论 上 来 说 ， 可 以 仅 用 NAND 门 构建 任何 组 合 电路 。 此 :十 >- 


R 


外 ，NAND 门 通 常 比 AND 门 和 OR 门 更 容易 制造 ， 因 此 NAND 

门 是 目前 集成 电路 中 最 常用 的 门 。 
当然 ， 同 样 的 原理 也 适用 于 对 偶 电 路 。 两 级 电路 的 德 . 摩根 

定律 是 图 10-23 ”三 个 等 价 的 电路 
(a+b+c)\(d+et+f)=[(at+tbt+c)'+(dt+etf)']’ 

这 说 明 OR-AND 电路 等 价 于 NOR-NOR 电路 。 图 10-24 是 图 10-22 的 对 偶 电 路 。 


‘J > EO, 
re > gD 


a) 一 个 OR-AND 电 路 b) 等 价 的 NOR-NOR 电 路 c) 与 bj 相同 的 NOR-NOR 电 路 
图 10-24 一 个 OR-AND 电路 及 其 等 价 的 NOR-NOR 电路 


适用 于 NAND 电路 的 推理 同样 适用 于 NOR 电路 。 任 何 组 合 电路 都 可 以 写成 一 个 两 级 
OR-AND 电路 ， 这 个 两 级 电路 可 以 写成 NOR-NOR 电路 。 连 接 NOR 的 输入 可 以 得 到 反 相 
器 。 理 论 上 仅 用 NOR 门 就 可 以 构建 任何 组 合 电路 。 

10.3 组合 设计 

两 级 电路 的 高 速 是 其 优 于 两 级 以 上 门 电路 的 优势 。 有 时 候 ， 在 两 级 电路 中 减少 门 的 数量 
并 保持 两 级 门 延 迟 的 处 理 速度 是 可 行 的 。 

例 10.19 布尔 表达 式 

x (a, b, c, d) = a'bd'+ a'c'd'+ a'bc'd' 
可 以 用 吸收 率 简 化 为 
x (a, b, c, d) = a'bd'+ (a'c'd') + (a'c'd')b 
= a'bd'+ a'c'd' 


这 个 表达 式 也 对 应 于 两 级 电路 ， 但 是 它 只 需要 两 个 三 输入 AND 门 和 一 个 两 输入 OR 门 ， 而 
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原始 表达 式 对 应 的 电路 需要 三 个 AND 门 和 一 个 三 输入 OR 门 ， 其 中 一 个 AND 门 还 需要 四 
输入 。 口 

用 布尔 代数 来 简化 两 级 电路 中 门 的 数量 并 不 总 是 简单 明了 的 。 本 节 给 出 一 种 图 形 化 的 方 
法 来 设计 具有 3 个 或 4 个 变量 且 门 数量 尽 可 能 少 的 两 级 门 电路 。 


10.3.1 范式 


上 一 节 讲 述 了 任何 布尔 表达 式 都 能 转换 成 一 个 两 级 AND-OR 表达 式 。 要 简化 两 级 电路 ， 
首先 要 使 每 个 AND 项 只 包含 所 有 输入 变量 一 次 ， 这 样 的 AND 项 称 为 极 小 项 ( minterm ) 。 
AND-OR 表达 式 总 是 可 以 转换 成 极 小 项 的 OR。 

例 10.20 考虑 布尔 表达 式 

x(a, b, c) = abc + a'bc + ab 
因为 前 两 个 AND 项 包含 所 有 三 个 变量 ， 因 此 它们 是 极 小 项 ， 但 最 后 一 个 不 是 。 转 换 过 程 如 下 
x(a, b, c) = abc + a'bc + ab 
= abc +a'bc + ab(c + c") 
= abc + a'bc + abc + abc' 
= abc + a'bc + abc' 
最 后 的 表达 式 称 为 范式 (canonical expression)， 因 为 它 是 没有 重复 的 极 小 项 的 OR. 口 

范式 中 的 每 个 极 小 项 代表 真 值 表 里 的 一 个 1， 所 以 范式 直接 和 真 值 表 相 关 。 范 式 及 其 对 
应 真 值 表 的 方便 的 简化 表示 法 叫 作 西格玛 表示 法 (sigma notation)， 它 由 大 写 希 腊 字 母 西 格 
3 (>) 后 面 跟 一 组 十 进 制 数字 组 成 ， 这 些 数字 对 应 真 值 表 中 包含 1 的 行 ， 大 写 的 西格玛 代 
表 OR 运算 。 不 言 而 喻 ,没有 列 出 的 行 都 是 包含 0 的 行 。 

例 10.21 在 例 10.20 中 ， 因 为 x 的 范式 有 3 个 极 小 项 ， 
papra Pw ed 


eda 
x(a, b, c) = 4(3, 6, 7) 
因为 第 3、6 和 7 行 含 有 1. oO} 4 |1lololo| 
对 偶 范 式 是 一 个 OR-AND 表达 式 ， 它 的 每 一 项 只 包含 所 有 | s [1 foi] o| 
变量 一 次 ， 没 有 重复 的 OR 项 。 这 个 范式 相应 的 表示 法 包含 的 | 6 |1|1|0o|1| 
是 真 值 表 中 0 组 成 的 列表 。 这 里 使 用 大 写 希 腊 字 母 派 (I) 表 | 7 lile 
示 AND 运算 ， 而 不 是 西格玛 。 图 10-25 “一 个 范式 的 真 值 表 

例 10.22 前 面 例 子 的 对 偶 范 式 为 
x (a,b,c) = (a+b+c)j(at+b+c')(at+b'+ c)(a'+b+c)(a't+b+c') 


用 派 表 示 法 可 以 写成 






x (a, b, c) =I1 (0, 1, 2, 4, 5) 
因为 这 5 行 在 真 值 表 里 为 0。 口 
例 10.23 使 用 西格玛 表示 法 ,图 10-3 Px 和 ?为 | 
x (a, b, c) = X(1, 3) 
y (a, b, c) = 4(3, 4) 
图 10-4 P RŽ x AI y A 
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x (a, b, c, d) = 2(5, 7, 13, 15) 
y (a, b, c; d) = 3(4, 5, 12, 13) 口 
西格玛 和 派 表 示 法 要 比 布尔 范式 和 真 值 表 更 简洁 。 本 节 剩 下 的 部 分 假设 要 简化 的 函数 已 
经 转换 为 它 的 唯一 范式 ,或 者 说 已 经 给 定 或 确定 了 真 值 表 。 


Ada Byron， 洛 夫 莱 斯 伯 事 夫人 

Ada Byron, 1815 年 12 月 10 日 生 于 伦敦 。 她 是 浪漫 主义 诗人 和 拜 伦 勋 碳 〈《Lord Byron) 
的 女儿 ， 但 是 她 并 不 认识 拜 伦 ， 因 为 Ada 才 出 生 一 个 月 ， 和 拜 伦 就 离开 了 她 的 母亲 。 母 亲 
为 了 抵消 她 的 父亲 危险 的 诗歌 秉性 ， 特 意 让 她 学 习 音 乐 和 数学 。 

17 岁 时 ，Ada 遇 到 了 剑桥 的 数学 教授 Charles Babbage， 开 始 了 一 段 长 期 的 交往 ， 两 
人 之 间 有 大 量 主 题 范围 广泛 的 通信 ， 包 括 数 学 和 还 辑 。Ada 在 1935 年 与 William King 4 
婚 ， 生 了 3 个 孩子 。King BRT HAA, MINAS MABARIMA e108 HRA. 

Babbage 主要 因 其 在 计算 机 器 建造 原理 方面 超越 时 代 的 远见 而 闻名 。 他 提出 两 类 
机 器 : 用 来 计算 数学 表 的 差分 机 (difference engine) 和 功能 更 强大 的 分 析 机 (analytical 
engine)。 机 器 由 打 孔 的 卡 控 制 ， 能 够 进行 通用 的 计算 。 与 遇 辑 门 处 理 数 字 位 1 和 0 的 方 
式 相 同 ，Babbage 的 机 器 用 卡 上 有 和 孔 和 无 孔 来 表示 一 个 位 的 值 。 不 过 ， 经 济 和 体制 上 的 阻 
碍 使 得 他 没 能 建造 出 那些 较 大 的 机 器 。 


1841 年 秋天 ，Babbage 在 意大利 的 一 个 学 术 讨 论 会 上 报告 了 他 的 分 析 机 。Luigi 


Menabrea 以 法 语 发 表 了 一 篇 题 为 “Charles Babbage 创造 的 分 析 机 概述 ”的 论文 ，Ada 把 
它 翻 译 成 了 英语 。 当 她 向 Babbage 展示 译文 时 ， 他 建议 她 可 以 加 上 
自己 的 注释 。Ada 的 注释 是 原来 的 文章 的 三 倍 ， a ee 

Ada 懂得 如 何 控制 分 析 机 以 生成 重要 的 数学 , HANZA 
žk (Bernoulli number) 就 是 一 个 例子 。 Loa ee ies 
中 的 重要 概念 ，Bernoulli 本 人 计算 出 了 前 十 个 贝 努 利 数 ， 数 学 家 
Euler 算 到 了 第 30 个 ， 后 来 Martin Ohm 在 1840 年 算 到 了 第 62 个。 
这 些 人 都 是 用 手工 计算 的 ， 而 Ada 在 Menabrea 的 分 析 机 论文 中 瑟 

了 一 个 程序 ， 能 够 控制 分 析 机 来 自动 计算 贝 努 利 数 。 

Ada Byron 被 认为 是 世界 上 第 一 个 程序 员 ， 她 预测 机 器 能 够 生 
成 图 形 图 像 甚至 音乐 。1979 年 ， 一 种 编程 语言 被 命名 为 Ada， 目 前 
仍 在 广泛 使 用 。Ada 于 1852 年 11 月 27 日 逝世 ， 年 仅 37 岁 ， 被 埋 
在 她 并 不 认识 的 父亲 身边 。 
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10.3.2 三 变量 卡 诺 图 


两 级 电路 的 简化 是 基于 距离 的 概念 。 两 个 极 小 项 之 间 的 距离 (distance) 是 它们 不 同 之 处 
的 数量 。 
例 10.24 来 看 一 下 这 个 三 变量 函数 的 范式 : 
x(a, b, c) = a'bc + abc + abc' 
极 小 项 a'bc 和 abe 之 间 的 距离 是 1， 这 是 因为 a' 和 a 是 这 两 个 极 小 项 唯一 不 同 的 变量 ， 两 
者 中 变量 上 和 c 是 相同 的 。 极 小 项 wpc 和 abe' 的 距离 是 2， 这 是 因为 a'bc 中 的 a Ale F 
apc' 中 的 a 和 c' 不 相同 。 O 
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识别 相 领 极 小 项 ( adjacent minterm), BUFR RA 1 的 极 小 项 ， 是 简化 AND-OR 表达 式 的 
关键 。 一 旦 找到 两 个 相 邻 极 小 项 ， 就 可 以 用 分 配 律 提出 公共 项 ， 再 用 取 补 和 短 等 性 简化 它 。 

例 10.25 可 以 像 下 面 那样 合并 前 两 个 极 小 项 来 简化 例 10.24 中 的 表达 式 : 

x(a, b, c) = a'bc + abc + abc' 
= (a'+ a)bc + abc' 
= bc + abc' 

或 者 可 以 合并 第 二 和 第 三 个 极 小 项 ， 因 为 它们 也 是 相 邻 的 。 
l x(a, b, c) = a'bc + abc + abc' 
= a'bc + ab(c + c’) 
= a'bc + ab 

无 论 哪 种 方式 都 改进 了 电路 。 原 表达 式 是 一 个 有 三 个 三 输入 AND 门 和 一 个 三 输入 OR 
门 的 电路 。 两 个 简化 表达 式 对 应 的 电路 都 仅 有 两 个 AND 门 ， 其 中 之 一 仅 有 两 个 输入 ， 以 及 
一 个 仅 有 两 输入 的 OR 门 。 

识别 相 邻 极 小 项 是 很 容易 的 。 为 了 得 到 更 小 的 最 终 电 路 ， 有 时 候 会 临时 使 表达 式 更 加 复 
杂 。 当 一 个 极 小 项 和 其 他 两 个 极 小 项 相 邻 时 就 会 发 生 这 样 的 情况 ,可 以 用 具 等 性 复制 这 个 极 
小 项 ， 再 把 它 和 它 的 两 个 相 邻 极 小 项 合并 。 口 

例 10.26 在 例 10.25 中 可 以 首先 用 舌 等 性 复制 abc， 然 后 再 和 男 两 个 极 小 项 合并 。 

x(a, b, c) = a'bc + abc + abc' 
= a'bc + abc + abc + abc' 
= (a'+ a)bc + ab(c + c’) 
= bc + ab 
这 个 结果 要 好 于 例 10.25 中 的 结果 ， 因 为 两 个 AND 门 都 只 有 两 个 输入 。 口 

用 布尔 代数 进行 简化 枯燥 且 容 易 出 错 。 卡 诺 图 是 一 个 简化 两 级 电路 的 工具 ， 它 能 很 容易 
地 找 出 相 邻 极 小 项 ， 确 定 需要 用 和 究 等 性 复制 哪些 项 。 卡 诺 图 只 是 一 个 组 织 过 的 真 值 表 ， 相 邻 
的 条 目 代表 只 有 一 个 不 同 之 处 的 极 小 项 。 

图 10-26a 展示 的 是 一 个 三 变量 卡 诺 图 。 左 上 单元 代表 abc = 二 0， 它 的 右边 是 代表 
abc = 001 的 单元 ， 再 往 右 是 代表 abe = 011 的 单元 ， 接 着 是 abc = 010。 序 列 000、001、 
010、011 保证 了 相 邻 单元 只 有 1 个 不 同 。 如 果 按 照 数 字 顺 序 排 列 单元 000、001、010、011 
就 不 会 有 这 种 效果 了 ， 因 为 001 和 010 的 距离 是 2。 

图 中 最 上 面 的 一 行 包 含 了 真 值 表 中 a = 0 的 条 目 ， 最 下 面 一 行 包含 了 a = 1 的 条 目 。 每 
一 列 是 bc 的 值 ， 例 如 ， 第 一 列 是 pc = 00， 第 二 列 是 bc = 01， 最 左边 两 列 是 b= 二 0， 最 
右边 两 列 是 = 1, WA 10-26b 所 示 。 外 边 的 两 列 是 c = 0， 中 间 的 两 列 是 c= 二 1， 如 
图 10-26c 所 示 。 





a) FRI b) b=1 的 区 域 c) c=0 的 区 域 
图 10-26 一 个 三 变量 函数 的 卡 诺 图 
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用 布尔 代数 提取 出 相 邻 极 小 项 的 公共 项 相当 于 在 卡 诺 图 上 对 相 邻 单元 分 组 。 在 对 单元 分 
组 之 后 ， 通 过 检查 卡 诺 图 的 区 域 可 以 写 出 简化 项 。 

例 10.27 图 40-27a 展示 的 是 范式 

x(a, b, c) = a'bc + a'be' 

的 卡 诺 图 。 

abc = 011 对 应 单元 中 的 1 是 极 小 项 
a'bc 的 真 值 表单 元 。 图 10-27b 是 同样 的 卡 
诺 图 ， 只 是 为 了 清晰 省 略 了 0。 因 为 这 两 
个 1 是 相 邻 的 ， 所 以 可 以 用 椭圆 把 它们 图 
EK. PARTE Aca a = 0 的 行 和 4b = rr 
1 的 列 ， 因 此 是 ab = 01 的 区 域 ， 这 对 应 
于 a 项, Alt x(a, b, c) = a'b。 可 以 不 用 图 10-27 BY 10.27 的 AND-OR 表达 式 的 卡 诺 图 
布尔 代数 ， 仅 通过 观察 就 写 出 结果 。 口 

例 10.28 图 10-28a 展示 的 是 规范 表达 式 


x(a, b, c) = ab'c' + abc' 





KERER., 





a) FEBI b) a 的 区 域 c)c， 的 区 域 
图 10-28 例 10.28 的 AND-OR 表达 式 的 卡 诺 图 


看 上 去 ab'c' 单元 在 左下 角 ，abc' 单元 在 右 下 角 ， 两 者 是 不 相 邻 的 ， 但 是 实际 上 它们 是 
相 邻 的 。 应 该 把 卡 诺 图 想象 成 环绕 的 ， 因 此 它 的 左边 和 右边 是 相 邻 的 ， 这 就 是 所 谓 的 Pac- 
Man 效应 。 在 图 中 将 一 个 椭圆 画 成 了 两 个 开放 的 半 椭 圆 来 表达 卡 诺 图 的 这 个 属性 。 

这 两 个 单元 都 位 于 a = 1 行 和 c= 二 0 列 ， 如 图 10-28b 和 图 10-28c 所 示 。 可 以 把 两 个 
单元 想象 成 图 中 阴影 区 域 的 交集 ， 这 个 区 域 是 ac = 10。 因 此 简化 的 函数 是 x(a, b,c) = ac'。 OF 

用 知 等 属性 复制 一 个 极 小 项 ， 这 样 它 可 以 和 男 两 个 极 小 项 合并 ， 对 应 于 卡 诺 图 中 两 个 椭 
AKER., WR AND-OR 表达 式 中 不 止 两 个 极 小 项 ， 那 么 就 可 以 随意 把 真 值 表 中 的 1 与 多 
个 组 合 使 用 。 

例 10.29 图 10-29 展示 的 是 

x(a, b, c) = a'bc + abc + abc' 

的 卡 诺 图 ， 这 是 例 10.26 的 规范 表达 式 。 图 10-29a 展示 的 是 合并 第 一 和 第 二 极 小 项 的 简化 ， 
图 10-29b 展示 的 是 合并 第 二 和 第 三 极 小 项 的 简化 ， 图 10-29c 中 两 个 合并 都 用 到 了 第 二 项 ， 
对 应 于 两 个 椭圆 的 重 释 。 口 

当 原 始 的 真 值 表 采 用 西格玛 表示 法 时 ， 可 以 在 卡 诺 图 中 1 的 位 置 插入 图 10-30 所 示 的 十 
进 制 标号 。 
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a) a'bc + abc = bc b) abc + apc' = ab c)x= bc + ab 
图 10-29 例 10.26 的 AND-OR 表达 式 的 卡 诺 图 


简化 的 过 程 就 是 要 确定 最 好 的 一 组 椭圆 来 覆盖 卡 详 图 中 所 
有 的 1. “最 好 ”的 意思 是 这 组 椭圆 对 应 于 一 个 两 级 电路 ， 它 有 
最 少 的 门 ， 每 个 门 有 最 少 的 输入 。 椭 圆 的 数量 等 于 AND 门 的 数 
量 , 一 个 椭圆 覆盖 的 1 越 多 ， 对 应 的 AND 门 的 输入 就 越 少 。 所 
以 要 得 到 最 少 的 椭圆 数 ， 每 个 椭圆 要 尽 可 能 多 地 覆盖 所 有 的 1 
而 不 覆盖 0。 人 允许 1 被 多 个 椭圆 覆盖 。 下 面 几 个 例子 展示 了 确定 ”图 10.30 卡 诺 图 中 最 小 项 
椭圆 的 一 般 策 略 。 的 十 进 制 标 号 

例 10.30 图 10-31 展示 的 是 一 个 简化 时 常见 的 错误 。 要 
简化 





be 


00 01 11 10 





x(a, b,c) = 2(0, 1, 5, 7) 
可 能 首先 想 合并 极 小 项 1 和 5， 如 图 10-31a 所 示 。 一 开始 就 这 样 做 并 不 好 ， 因 为 极 小 项 1 与 
0 和 5 都 相 邻 ， 极 小 项 $ 与 1 和 7 都 相 邻 。 另 一 方面 ， 极 小 项 0 只 和 1 相 邻 。 要 用 尽 可 能 大 
的 椭圆 覆盖 极 小 项 0， 就 必须 将 它 和 1 合并 。 类 似 地 ， 极 小 项 7 只 和 5 相 邻 ， 要 用 尽 可 能 大 
的 椭圆 覆盖 它 ， 就 必须 将 它 和 5 合并 。 

图 10-31b 展示 的 是 这 种 极 小 项 分 组 的 结果 ， 代 表 表 达 式 
x(a, b, c) = L(0, 1, 5, 7) 
= q'b'+ b'c + ac 

这 需要 3 个 两 输入 AND 门 和 1 个 三 输入 OR 门 。 但 第 一 个 分 组 选择 并 不 是 必需 的 。 
图 10-31c 给 出 了 正确 的 简化 ， 它 表示 

x(a, b; c) = 2(0, 1, 5, 7) 









= a'b'+ ac 
这 个 实现 只 需要 两 个 两 输入 AND 门 和 一 个 两 输入 OR 门 。 口 
bc b 
01 11 10 <—_____> 
° cA |} e | 
paa 
A ool | | OD 
é | 
a) 一 种 不 好 的 策略 b) 这 种 不 好 的 策略 的 结果 c) 正确 的 简化 结果 


图 10-31 一 开始 选择 不 好 的 结果 
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前 面 的 例子 告诉 我 们 一 个 经 验 ， 即 从 只 有 一 个 邻居 的 极 小 项 开始 分 组 ， 因 为 无 论 如 何 邻 
居 必 须 和 它们 一 起 分 组 ， 因 此 可 以 节省 一 个 不 必要 的 邻居 组 成 的 分 组 。 
另 一 个 常见 的 错误 是 无 法 找到 一 个 大 的 1 的 分 组 ， 如 例 10.31 
所 示 。 
例 10.31 图 10-32a 展示 的 是 一 个 三 变量 晒 数 的 简化 
x(a, b,c) = È (0, 2, 4, 6, 7) m 
= þ'c'+ bc'+ ab 
它 需 要 三 个 两 输入 AND 门 和 一 个 三 输入 OR TI. Al 10-32b Æ 
正确 的 简化 ， 即 





cd 


00 01 ll 10 


x(a, b, c) = c'+ ab 
这 只 需要 一 个 两 输入 AND 门 和 一 个 两 输入 OR 门 。 o 
在 三 变量 问题 中 ， 四 个 1 的 分 组 相当 于 只 有 一 个 变量 的 
AND 项 。 因 为 一 个 组 中 1 的 个 数 一 定 是 对 应 于 a、b、c UKRE 
们 的 补 的 区 域 的 交集 ， 因 此 组 中 1 的 数量 一 定 是 2 YE. BEN, 
一 个 椭圆 可 以 覆盖 1、2 或 4 个 1， 但 是 绝 不 会 是 3 或 5 个 1。 


10.3.3 ”四 变量 卡 诺 图 


四 变量 电路 的 简化 遵循 和 三 变量 电路 一 样 的 步骤 ， 除 了 卡 诺 图 中 条 目的 数量 是 三 变量 的 
两 倍 以 外 。 图 10-33a 是 单元 的 排列 。 不 仅 极 小 项 0 和 2 相 邻 .4 和 6 相 邻 ， 而 且 极 小 项 12 
和 14、8 和 10 也 相 邻 。 同 时 ， 最 上 面 一 行 的 单元 和 最 下 面 一 行 对 应 的 单元 也 相 邻 ， 即 极 小 
项 0 和 8、1 和 9、3 和 11、2 和 10 相 邻 。 

三 变量 卡 诺 图 中 每 个 单元 有 三 个 相 邻 单元 。 在 四 变量 卡 详 图 中 ， 每 个 单元 有 四 个 相 邻 单 
元 。 人 例如， 与 10 相 邻 的 是 2、8、11 和 14, 与 4 相 邻 的 是 0、5、6 和 12。 

图 10-33b 展示 的 是 变量 为 1 的 真 值 表 区 域 。 变 量 a 在 下 面 两 行为 1， 变 量 b 在 中 间 两 
行为 1， 变量 c 在 右边 两 列 为 1， 变量 d 在 中 间 两 列 为 1。 

例 10.32 图 10-34 展示 的 是 对 

x(a, b, c, d) = Z0, 1, 2, 5, 8, 9, 10, 13) 





b) 正确 的 简化 
图 10-32 无 法 找 出 大 的 分 组 












= c'd + b'd' 
的 简化 。 注 意 四 个 角 上 的 单元 可 以 被 组 合成 wd' ， 卡 诺 图 的 第 二 列 代 表 c'do . C 
SOO | 

os | fuji 


a) 卡 诺 图 中 最 小 项 的 十 进 制 标号 b) 变量 为 1 的 区 域 
图 10-33 WEERA KIA 图 10-34 = fa 4E— DE PK 
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例 10.33 图 10-35 展示 的 是 
x(a, b,c, d) = &%(0, 1, 2, 5, 8, 9, 10,) 
= a'c'd + b'c'+ b'd' 
的 简化 。 和 例 10.32 相 比 ， 尽 管 只 少 了 一 项 ， 但 是 简化 结果 是 完全 不 同 的 。 
极 小 项 5 只 有 一 个 相 邻 的 1， 因 此 根据 经 验 法 则 首先 将 它 和 1 组合， 这 个 组 合 的 AND 
项 是 a'c'd, 可 以 通过 观察 顶 页 部 两 行 (a')、 左 边 两 列 (c') 和 中 间 两 列 〈d) 的 交集 来 确定 。 
用 最 大 的 椭圆 覆盖 极 小 项 9 需要 把 它 与 0、1 和 8 组合， 而 不 是 只 与 8 组合， 这 个 组 合 
的 AND 项 是 gc'， 可 以 通过 观察 顶部 和 底部 行 (b') 与 左边 两 列 〈c') 的 交集 来 确定 。 
剩 下 还 没有 被 覆盖 的 1 是 极 小 项 2 和 10， 和 前 面 一 样 ， 它 们 与 0 和 8 组 合 。 口 
例 10.34 图 10-36 展示 的 简化 结果 可 能 不 是 唯一 的 。 下 面 这 个 函数 有 两 个 合法 的 简化 
结果 
x(a, b, c, d) = È (0, 4, 7, 8, 12, 13, 15) 
= c'd'+ bcd + abc’ 
= c'd'+ bcd + abd 
首先 应 该 组 合 的 极 小 项 是 7， 因 为 它 只 有 一 个 相 邻 项 1。 极 小 项 0 必须 和 4、8 和 12 组 合 ， 
因为 它 没 有 其 他 可 能 的 组 合 方式 。 这 样 就 只 剩 下 13 了 ， 它 可 以 和 12 或 者 15 组 合 。 口 






cd 
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图 10-35” 比 图 10-34 少 一 个 最 a) 一 种 可 能 的 简化 b) 另 一 种 不 同 的 简化 
小 项 的 表达 式 图 10-36 ”两 种 正确 的 不 同 简化 
简化 四 变量 孔 数 并 不 总 是 简单 明了 的 ， 有 时 候 为 了 确定 真正 最 小 的 结果 ， 必 须 尝 试 几 种 
不 同 的 组 合 。 


Hj 10.35 图 10-37 展示 的 就 是 这 样 的 问题 。 该 晒 数 为 
> (0, 1, 2, 3, 5, 6, 7, 8, 9, 12, 13, 14) 
图 10-37a 是 下 面 推理 的 结果 。 来 看 极 小 项 12， 它 所 属 的 最 大 组 是 对 应 ac’ 的 四 项 组 ， 类 似 
的 极 小 项 6 所 属 的 最 大 组 合 是 四 项 组 a'c。 给 定 这 两 个 组 合 ， 可 以 把 极 小 项 5 组 合 到 cd 中 ， 
极 小 项 0 组 合 到 a'b' 中 ， 极 小 项 14 组 合 到 bed’ 中 。 表 达 式 
ac'+ a'c + c'd + a'b'+ bcd' 

似乎 是 合理 的 ， 因 为 没有 哪个 组 合 看 上 去 是 元 余 的 ， 去 掉 任 何 一 个 椭圆 都 会 有 1 没 被 覆盖 到 。 

给 定 前 两 步 的 选择 ， 余 下 的 三 个 组 合 可 能 都 是 最 好 的 选择 。 问 题 就 在 于 第 二 步 的 选择 。 

图 10-37b 是 下 面 推理 的 结果 。 和 前 面 一 样 ， 极 小 项 12 在 组 合 ac' 中 。 现 在 来 考虑 极 小 
项 14， 它 必须 和 12 或 者 6 组 合 。 因 为 12 已 经 被 覆盖 了 ， 所 以 14 和 6 组 合 。 把 剩 下 的 0、1、 
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2. 3. 5, 组 合 到 一 AERA MN 如 图 10-37b 所 示 。 得 到 的 表达 式 
ac'+ a'd + a'b'+ bcd' 
比 图 10-37a 少 一 个 AND 门 。 
这 是 一 个 麻烦 的 问题 ， 因 为 通常 应 该 用 最 大 可 能 的 组 合 来 覆盖 1。 然 而 通用 的 规则 不 适 
用 于 这 个 问题 。 一 旦 确定 了 组 ae， 就 不 该 把 极 小 项 6 放 进 最 大 的 可 能 的 组 里 了 。 
通过 图 10-38 可 以 看 到 这 个 问题 的 解决 方案 不 是 唯一 的 ， 它 首先 把 极 小 项 6 组 合 在 a'c 
中 ， 接 着 把 14 和 12 组合， 结果 为 
a'c + b'c'+ c'd + abd' [ 





d 
a) 一 种 可 行 但 是 不 好 的 简化 b) 正确 的 简化 
图 10-37 一 个 复杂 的 简化 问题 图 10-38 图 10-37 的 函数 的 
男 一 种 正确 的 简化 
在 面 对 一 个 复杂 的 卡 诺 图 时 ， 如 何 才 能 知道 该 怎样 组 合 极 小 项 呢 ?” 其 实 就 是 需要 多 练 
习 、 推 理 和 一 点 点 试验 。 


10.3.4 XHAFER 


为 了 简化 OR-AND 表达 式 孔 数 ， 可 以 简化 AND-OR 表达 式 形式 的 函数 的 补 ， 使 用 
例 10.36 图 10-39 展示 的 是 对 图 10-29 中 国 数 的 补 的 简 
化 。 原 函数 是 
本 
= II (0, 1,2, 4,5) 





它 的 补 如 图 所 示人 简化 为 
x'(a, b,c) = %(0, 1, 2, 4, 5) 图 10-39 图 10-29 的 函数 的 补 
= b'+a'c' 
简化 后 的 OR-AND 表达 式 的 原 函 数 是 
x (a, b, c) = (x(a, b,c)) 
= (b'+ a'c')' 
= b(a+c) 
简化 的 AND-OR 表达 式 


x (a,b,c) = bc + ab 
需要 3 个 门 ， 而 这 个 表达 式 只 需要 两 个 门 。 口 
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在 上 面 的 例子 中 ， 用 一 个 两 级 NOR-NOR 电路 而 不 是 NAND-NAND 电路 来 实现 函数 是 
很 划算 的 。 通 常情 况 下 ， 必 须 简 化 两 种 格式 来 确定 哪个 需要 更 少 的 门 。 


10.3.5 无 关 条 件 


有 了 时候 组 合 电 路 设计 只 是 为 了 处 理 某 些 输入 的 组 合 ， 其 他 组 合 永 远 不 会 出 现在 输入 
中 。 即 使 这 些 条 件 出 现 我 们 也 不 关心 输出 是 什么 ， 所 以 这 些 组 合 称 为 无 关 条 件 ( don’t-care 
condition ) 。 


在 简化 过 程 中 ， 无 关 条 件 会 带 来 额外 的 灵活 性 。 当 存在 无 关 条 件 时 ， 可 以 随意 设计 电 


路 产生 0 或 1 。 通 过 有 选择 地 让 一 些 无 关 条 件 生 成 1 ， 另 一 些 生 成 0 ， 这 样 可 以 改进 简化 


结果 。 
例 10.37 图 10-40a 是 不 用 无 关 条 件 进行 简化 
x (a,b,c) = X (2,4,6) ee 
Saera” s LA 
现在 假设 不 用 极 小 项 0 和 7 生成 0， 在 这 个 问题 中 ， 这 两 个 极 小 “1 十 个 i 
eather en DRE 


x (a, b,c) => i 2. 4,6) +d (0, 7) a) PHARRR BL 
这 里 在 极 小 项 标号 前 面 的 4 代表 无 关 条 件 。 图 10-40b HY Fa R 


b 
中 标记 为 “X ”的 单元 就 表示 无 关 条 件 。 \ 
de ， 可 以 自由 地 覆盖 或 者 不 覆盖 标记 naa 
wx” WMT. X ”就 像 通配符 ， 把 它 看 作 0 或 1 均 可 .在 af J | x [OL 


本 例 中 ， 如 果 把 极 小 项 0 看 作 1，7 看 作 0, 简化 的 结果 就 是 





x (a,b,c) = > (2,4,6) +d(0, 7) 1» TSH ee 
= SLD 4 6) 
sa 图 10-40 无关 条 件 
不 用 无 关 条 件 ， 这 个 肾 数 需要 两 个 AND 门 和 一 个 OR 门 ， 如 果 使 用 无 关 条 件 ， 就 不 需要 
AND [J&A OR 门 了 。 o 


10.4 组 合 设备 


本 节 讲 述 一 些 在 计算 机 设计 中 普遍 用 到 的 组 合 设 备 。 每 个 设备 都 可 以 被 描述 成 一 个 黑 
盒子 ， 有 一 个 对 应 的 真 值 表 定义 了 输出 和 输入 的 关系 。 本 节 的 所 有 设备 都 是 组 合 ， 可 以 用 两 
级 AND-OR 电路 来 实现 。 这 里 展示 的 一 些 实现 用 处 理 时 间 来 换取 更 小 的 空间 ， 即 更 少 的 门 ， 
可 能 不 止 两 级 。 


10.4.1 视角 


下 面 的 几 个 设备 有 一 条 叫 作 使 能 (enable) 的 输入 线 。 使 能 线 就 像 设 备 的 开关 ， 如 果 使 
能 线 为 0， 不管 输入 线 的 值 是 什么 ,输出 线 都 是 0。 此 时 ,设备 为 关闭 或 禁用 状态 。 如 果 使 
能 线 为 1， 根据 描述 这 个 设备 的 函数 ， 输 出 线 由 输入 决定 。 此 时 ,设备 为 打开 或 使 能 状态 。 

AND 门 可 以 实现 使 能 属性 ， 如 图 10-41a 所 示 。 线 a 是 这 个 组 合 电 路 (没有 在 图 中 显示 ) 
的 输入 之 一 ， 是 一 个 AND 门 的 输入 。 该 AND 门 的 另 一 个 输入 是 使 能 线 。 

当 使 能 线 为 1 时 ， 
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x = a > (enable) 
=a:l 
=a 
输出 等 于 输入 ， 如 图 10-41b 所 示 。 当 使 能 线 为 0 时 ， 不 管 输入 是 什么 ， 
x = a* (enable) 
=a:0 
= 0 


Enable = 1 


如 图 10-41c 所 示 。 


DE 


Enable 


Enable = 0 





a) 使 能 门 的 逻辑 图 b) 设备 开启 时 的 真 值 表 c) 设备 关闭 时 的 真 值 表 
图 10-41 AND 的 输入 作为 使 能 





实现 使 能 属性 不 需要 一 个 新 的 “使 能 门 "， 只 需 用 一 个 不 同 的 视角 来 看 待 我 们 熟悉 的 
AND 门 。 可 以 把 输入 a 看 作 数据 线 ， 把 使 能 线 看 作 控 制 线 。 使 能 通过 让 数据 完全 不 变 地 通 
过 门 或 者 阻止 它 通 过 门 来 控制 数据 。 

另 一 个 很 有 用 的 门 是 选择 反 相 器 (selective inverter) 。 输 入 有 一 条 数据 线 和 一 条 反 相 线 。 
如 果 反 相 线 为 1， 那么 输出 是 数据 线 的 补 ; 如 果 反 相 线 为 0， 输入 不 改变 地 通过 门 到 达 输 出 。 

从 图 10-42a 可 以 看 到 选择 反 相 器 是 一 个 XOR 门 ， 只 不 过 换 了 一 个 和 以 往 不 一 样 的 视角 
来 看 。 当 反 相 线 为 1 时 ， 

x = a ® (invert) 
a' * (invert) + a * (invert)’ 
=a':lt+a:l' 


=a 
输出 等 于 数据 输入 的 补 ， 如 图 10-42b 所 示 。 当 反 相 线 为 0 时 ， 
x = a ® (invert) 
= q' + (invert) + a * (invert)’ 
=a':0+a:0’ 


数据 线 不 改变 地 通过 这 个 门 。 


invert = 1 





a) 选择 反 相 器 的 逻辑 图 b) 反 相 器 开启 时 的 真 值 表 c) 反 相 器 关闭 时 的 真 值 表 
图 10-42 XOR 的 输入 作为 反 相 选择 
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10.4.2 SA 


§ AZ (multiplexer) 是 从 几 个 数据 输入 中 选择 一 个 并 送 到 唯一 的 数据 输出 的 设备 。 控 
制 线 决定 要 让 哪个 数据 输入 通过 。 

图 10-43a 展示 的 是 一 个 八 输入 复 用 器 的 方块 图 。D0 ~ D7 是 数据 输入 线 ，S2 一 S0 是 
选择 控制 线 ，F 是 唯一 的 输出 线 。 

由 于 这 个 设备 有 11 个 输入 ， 所 以 完整 的 真 值 表 需 要 2 =2048 个 条 目 。 图 10-43b 是 
一 个 简略 的 真 值 表 ， 第 二 个 条 目 显示 当选 择 线 是 001 时 ， 输 出 是 D1。 也 就 是 不 管 D0 和 
D2 ~ D7 为 何 值 ， 如 果 D1 为 1，F 就 为 1， 如 果 D1 为 0, FF 就 为 0。 

因为 n 条 选择 线 可 以 选择 2" 条 数据 线 之 一 ， 所 以 复 用 表 的 数据 输入 的 数量 是 2 A 
图 10-44 展示 了 一 个 四 输入 复 用 上 需 的 实现 ， 它 包含 四 条 数据 线 DO ~ D3， 和 两 条 选择 线 S1 
和 S0。 


DO > 
DI -> 
Di => 
D3 ~ 
D4 —> 
DS —> 
D6 —> 
DI > 


ra 
S2 Sl SO 
a) 方块 图 b) 真 值 表 S0 


图 10-43 八 输 入 复 用 器 图 10-44 ”四 输入 复 用 器 的 实现 


Pep/8 中 STr 指令 的 实现 是 应 用 复 用 器 的 一 个 例子 。 这 条 指令 把 CPU BT AZ 
的 内 容 通过 总 线 放 进 内 存 ，CPU 用 一 个 两 输入 复 用 器 来 进行 选择 ， 实 现 这 个 功能 。 选 择 线 
来 自 寄存 器 -r 字段 ， 输 入 来 自 A 和 X 寄 存 器 ， 输 出 将 会 到 达 总 线 。 


10.4.3 二进制 译 码 器 


译 码 器 ( decoder) 以 一 个 二 进 制 数 字 作 为 输入 ， 把 几 条 数据 输出 线 中 的 一 个 设置 为 1， 
其 余 的 设置 为 0， 而 哪 条 数据 线 设 为 1 取决 于 输入 二 进 制 数字 的 值 。 

图 10-45a 展示 的 是 一 个 2X4 二 进 制 译 码 器 的 方块 图 。S1 和 S0 是 两 位 数字 输入 ， 
DO ~ D3 是 四 个 输出 ， 其 中 之 一 将 会 为 1; 图 10-45b 是 真 值 表 。 

因为 n 位 数字 会 有 2” 个 值 ， 所 以 译 码 右 数 据 输出 的 数量 是 2 EE. BI 10-46 展示 的 是 
一 个 2X4 译 码 右 的 实现 。 其 他 可 能 的 大 小 是 3X8 和 4X16。 

一 些 译 码 句 带 有 使 能 输入 。 图 10-47 是 一 个 市 使 能 输入 的 2X4 译 码 需 。 当 使 能 线 为 1 
时 ， 设 备 像 图 10-45b 那样 正常 运行 。 当 使 能 线 为 0 时 ， 所 有 输出 为 0。 实现 带 使 能 功能 的 
译 码 器 要 求 每 个 AND 门 有 一 个 附加 的 输入 ， 细 节 情 况 作 为 草 末 的 一 道 练 习题 。 

Pep/8 的 CPU 中 有 应 用 译 码 器 的 一 个 例子 。 一 些 指令 有 一 个 三 位 的 寻 址 -aaa 字段 ， 这 
个 字段 指定 八 种 寻 址 模式 之 一 。 硬 件 有 八 个 地 址 计算 单元 ， 每 个 模式 对 应 一 个 。 每 个 单元 有 





= = = =. © OOO 


0 
» a 
0 
l 
0 
l 
0 
1 


Z1IOF 组 全 电路 359 


一 条 使 能 线 。 三 条 aaa 地 址 线 输 入 到 一 个 3X8 译 码 器 ， 该 译 码 器 的 每 条 输出 线 将 会 使 能 八 
个 地 址 计算 单元 中 的 一 个 。 


SO 





a) 方块 图 b) 真 值 表 S0 
图 10-45 2X4 二进制 译 码 器 图 10-46 ” 2X4 二进制 译 码 器 的 实现 
10.4.4 多 路 分 配器 


复 用 需 是 把 几 个 数据 输入 值 中 的 一 个 发 送 到 唯一 的 输出 线 ， 多 路 分 配器 (demultiplexer) 
正好 相反 ， 它 把 唯一 的 输入 值 发 送 到 几 条 输出 线 之 一 。 

图 10-48a 是 一 个 四 输出 多 路 分 配器 的 方块 图 ， 图 10-48b 是 它 的 真 值 表 。 如 果 S1 和 SO 
为 01， 那 么 除 D1 之 外 的 所 有 输出 线 都 是 0，D1 的 值 和 数据 输入 线 的 值 一 致 。 





[si so [po pi p2 ps 
DO 
S1 —> D1 
D2 
so —> D3 
Enable 
图 10-47 带 使 能 的 2Xx4 a) 方块 图 b) 真 值 表 
HE EAS Ht 10-48 ”四 输出 解 调 器 


这 个 真 值 表 类 似 于 图 10-45b 的 译 码 需 的 真 值 表 。 多 路 分 配器 实际 上 就 是 一 个 带 使 能 功 
能 的 译 码 器 ， 数 据 输入 线 和 使 能 线 相 连接 。 如 果 D 为 0 则 译 码 需 被 禁用 ，S1 和 SO 选择 的 数 
据 输出 线 为 0 ; 如 果 D 为 1， 译 码 需 使 能 ， 选 择 的 数据 输出 线 为 1。 在 这 两 种 情况 中 ,选择 . 
的 输出 线 与 数据 输入 线 的 值 都 一 样 。 这 又 是 一 个 用 不 同 的 视角 来 思考 组 合 设备 得 到 一 种 非常 
有 用 的 运算 的 例子 。 


10.4.5 IMAR 


思考 下 面 的 二 进 制 加 法 
1011 
ADD 0011 


C=0 1110 
V=0 
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最 低位 (LSB) 的 和 是 1 加 上 1 等 于 0， 有 一 个 1 进位 到 下 一 列 。 要 将 两 个 数 的 最 低位 相 加 
需要 如 图 10-49a 所 示 的 半 加 器 (half adder)。 在 图 10-49 中 ，A 代表 第 一 个 数 的 最 低位 ，B 
代表 第 二 个 数 的 最 低位 。 本 例 中 ， 一 个 输出 是 Sum (和 ) 0， 另 一 个 输出 是 Carry (进位 ) 1。 
图 10-49b 是 真 值 表 。Sum 和 XOR 函数 一 样 ，Carry 和 AND 函数 一 样 。 图 10-49c 部 分 是 最 直 
观 的 实现 。 





Sum 


a) 方块 图 b) 真 值 表 c) 实现 
10-49 ” 半 加 器 


要 得 出 LSB 相 邻 列 的 和 就 需要 一 个 有 三 个 输入 的 组 合 电路 : Cin, AMB, Cin 是 来 自 
F LSB 进位 的 进位 输入 ，A 和 B 是 第 一 个 数 和 第 二 个 数 的 位 ， 输 出 是 Sum 和 Cout, Cout 
会 送 到 下 一 列 的 全 加 器 的 Cin。 图 10-50a 是 这 个 线路 的 方块 图 ， 称 为 全 加 器 full adder). 
图 10-50b 是 它 的 真 值 表 ， 如 果 三 个 输入 的 和 是 奇数 ， 则 Sum 为 1 ; 如果 三 个 输入 的 和 大 于 
1， 则 Cout 为 1。 

图 10-51 展示 的 是 一 个 全 加 器 的 实现 ， 使 用 了 两 个 半 加 器 和 一 个 AND 门 。 第 一 个 半 加 
人 船 将 A 和 B 相 加 ， 第 二 个 半 加 器 将 第 一 个 半 加 器 的 和 与 Cin 相 加 ， 全 加 器 的 和 是 第 二 个 半 
加 筑 的 和 。 如 果 第 一 个 或 第 二 个 半 加 器 有 进位 ， 则 全 加 器 就 有 进位 。 


Cout 


0 
0 
0 
0 
l 
l 
l 
l 


— = OOF KF COO 
— O = O m. O = OO 
一 OOF OH O 
— = = O =- CO O OO 





a) 方块 图 b) 真 值 表 
图 10-50 ”全 加 器 图 10-51 用 两 个 半 加 器 实现 的 全 加 器 


要 将 两 个 4 位 数字 相 加 就 需要 一 个 八 输入 电路 ， 如 图 10-52a 所 示 。A3 A2 Al AO 是 第 
一 个 数字 的 4 位 ，A0 LSB, B3 ~ B0 是 第 二 个 数字 的 4 位 ，S3 S2 A S0 是 4 位 的 和 ，C 
是 进位 位 。 实 现 4 位 加 法 器 可 以 使 用 一 个 用 于 LSB 的 半 加 器 和 三 个 全 加 器 ， 剩 下 的 每 列 一 
个 全 加 器 。 因 为 从 LSB 位 开始 的 进位 要 像 波 浪 一 样 向 左边 的 列传 递 ， 所 以 这 个 实现 称 为 行 
波 进位 加 法 器 (ripple-carry adder), Al 10-52b 给 出 的 就 是 这 样 的 实现 。 
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A3 A2 Al AO B3 B2 Bl BO 


yy yy vu y 


S3 S2 Si SO 
a) 方块 图 





b) 实现 
图 10-52 ”四 位 行 波 进位 加 法 器 


行 波 进位 加 法 器 的 进位 是 最 左边 的 全 加 器 的 Cout。 如 果 把 整数 当 作 无 符号 数 ， 这 个 进 
位 位 就 表明 是 否 发 生 溢出 。 如 果 把 整数 当 作 二 进 制 补 码 表示 的 有 符号 数 ， 最 左边 的 位 是 符号 
位 ， 和 它 相 邻 的 是 数值 最 大 的 最 高 位 。 因 此 对 于 有 符号 数 ， 倒 数 第 二 个 全 加 器 的 Cout 信号 
(本 例 中 的 S2 ) 是 进位 位 。 

V 位 表示 把 数字 看 成 有 符号 数 时 是 否 发 生 溢出 。 遇 到 下 面 两 种 情形 之 一 时 才 可 能 发 生 
溢出 : 

© A 和 B 都 是 正 数 ， 结 果 是 负数 。 

© A 和 B 都 是 负数 ,结果 是 正 数 。 

将 两 个 符号 不 同 的 整数 相 加 不 会 发 生 溢出 。 第 一 种 情况 中 A3 和 B3 都 是 0， 在 倒数 第 
二 个 全 加 器 一 定 会 有 进位 ， 这 个 进位 将 S3 置 为 1， 最 左边 的 全 加 器 的 Cout 为 0。 第 二 种 情 
况 中 A3 和 B3 都 是 1， 最 左边 的 全 加 器 一 定 有 一 个 进位 ， 倒 数 第 二 个 全 加 器 不 会 有 进位 ， 
因为 S3 一 定 是 0。 在 这 两 种 情况 中 ， 最 左边 全 加 器 的 进位 不 同 于 倒数 第 二 个 全 加 器 的 进位 ， 
但 这 正好 是 XOR 也 数 。 只 有 当 它 的 两 个 输入 不 同时 ， 它 才 为 1。 因 此 可 以 用 XOR 门 来 计算 
V 位 ， 两 个 输入 来 自 最 左 和 倒数 第 二 个 全 加 器 的 Cout 信和 号 。 

行 波 进位 加 法 器 最 主要 的 缺点 是 进位 必须 传递 经 过 所 有 全 加 器 才能 产生 有 效 的 结果 。 由 


于 加 法 是 非常 基础 的 数学 运算 ， 因 此 加 法 器 电路 得 到 了 广泛 研究 。 先 行进 位 加 法 器 通过 在 设 


计 中 加 入 一 个 先行 进位 单元 ， 解 决 了 行 波 进位 加 法 器 的 速度 劣势 。 更 复杂 的 加 法 器 超出 了 本 
书 的 讲述 范围 。 
10.4.6 加 法 器 /减法 器 

要 用 A 减 B， 可 以 按照 加 法 器 的 思路 设计 一 个 减法 絮 电 路 ， 只 不 过 相应 于 加 法 的 进位 
机 制 ， 它 要 有 借 位 机 制 。 不 过 ， 其 实 不 需要 构造 一 个 独立 的 减法 电路 ， 把 B 取 反 后 再 和 A 


相 加 更 简单 一 些 。 回 想 一 下 第 3 章 的 二 进 制 补 码 规则 : 
NEG x = 1+NOTx 
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对 一 个 数 取 反 时 ， 要 把 这 个 数 的 所 有 位 取 反 ， 然 后 加 1。 因 此 ， 要 构建 一 个 既是 加 法 器 又 是 
减法 器 的 电路 ， 需 要 通过 一 种 方法 有 选择 地 反 转 B 的 所 有 位 ， 还 需要 通过 一 种 方法 有 选择 地 
将 它 加 1。 幸运 的 是 XOR 门 能 够 实现 这 个 功能 ， 因 为 可 以 把 KOR 门 当 作 一 个 选择 反 相 髓 。 

图 10-53 展示 的 是 一 个 基于 这 个 思路 的 加 法 需 /减法 需 电 路 。 图 10-53a 中 的 方块 图 和 行 
波 进位 加 法 器 方块 图 相 比 ， 只 是 多 了 一 个 标识 为 Sub 的 控制 线 。 当 Sub = 0 时 ， 电 路 作为 
一 个 加 法 器 ， 当 Sub = 1 时 ， 这 个 电路 是 个 减法 器 。 


A2 Al A0 B3 B2 B1 BO 


IAT did 


<— Sub 
V 
S3 S2 S1 SO 
a) 方块 图 
A3 B3 A2 B2 Al BI A0 BO 
m Z Sub 
A B A B 
Cout Cin Cout Cin 
S S 
Sl SO 





图 10-53 ”四 位 行 波 进位 加 法 胡 / IE RE 


图 10-53b 是 这 个 电路 的 实现 。 对 于 加 法 器 电路 ， 最 低位 的 运算 只 需要 一 个 半 加 器 ， 加 
法 器 /减法 器 用 一 个 全 加 器 代替 它 。 考 虑 Sub = 0 的 情况 ， 这 样 最 低位 的 全 加 器 的 Cin 为 0， 
就 像 是 一 个 半 加 器 。 而 且 ， 对 于 上 面 四 个 XOR 门 ， 每 个 门 的 左边 的 输入 也 是 0， 它 使 得 B 
信和 号 毫 无 改变 地 通过 这 些 门 。 该 电路 计算 A 和 了 B 的 和 。 

现在 来 考虑 Sub = 1 的 情况 ， 由 于 上 面 四 个 XOR 门 左边 的 输入 都 是 1， 因 此 B 的 所 有 位 


取 反 。 而 且 ， 最 低位 的 全 加 器 的 Cin 是 1， 将 结果 加 1。 A B 
因此 这 个 和 是 A 加 上 B 的 反 的 和 。 
10.4.7 算术 逻辑 单元 ig A 


Pep/8 的 处 理 指令 包括 ADDr、ANDr 和 0Rr。 加 法 是 ss Cg 
算术 运算 ， 然 而 AND AOREW HAR. CPU aA 
括 一 个 简单 的 组 合 电路 ， 称 为 算术 逻辑 单元 Arithmetic 
Logic Unit，ALU)， 它 会 执行 这 些 运算 。 

图 10-54 展示 的 是 Pep/8CPU 的 ALU。 线 上 有 一 条 
小 斜 线 代 表 多 于 1 个 的 控制 线 ， 斜 线 旁 边 的 数字 指明 控 图 10-54 Pep/8 ALU 的 框图 





Result 
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制 线 的 数量 ， 标 记 为 ALU 的 线 代 表 四 条 线 。ALU 总 共有 21 条 输入 线 : A 输 入 8 条 线 ，B 
输入 8 条 线 ，4 条 线 用 于 指定 ALU 执行 的 功能 ， 还 有 一 条 Cin 线 。 它 有 12 条 输出 线 : Result 
8 条 线 ， 此 外 还 有 4 条 线 对 应 Result 的 NZVC 值 。 进 位 输出 线 标记 为 Cout， 区 别 于 进位 输 
AK Cin。 零 输出 线 标 识 为 Zout， 区 别 于 CPU 中 另 一 个 Z， 这 个 Z 将 在 第 12 章 中 讲述 。 

4 条 ALU 控制 线 指定 ALU 将 执行 16 种 功能 中 的 哪 一 个 。 图 10-55 列 出 了 这 16 种 功 
能 ， 其 中 大 多 数 直接 对 应 Pep/8 指令 集中 的 运算 。 因 为 “+” 符 号 通常 用 作 逻 辑 OR 运算 ， 
所 以 算术 运算 写成 “plus” 和 “minus”。 图 中 列 出 了 每 种 运算 对 应 的 NZVC 位 的 值 。 


> 
pe 
C 
湾 
it 
| 


A plus B 
A plus B plus Cin 


A plus B plus 1 
A plus B plus Cin 


> 
中 


| > > 
中 


> 





图 10-55 Pep/8 ALU 的 16 种 功能 


图 10-56 展示 的 是 ALU 的 实现 。 可 以 看 到 从 上 面 和 右边 进来 的 21 条 输入 线 和 底部 出 来 
的 12 条 输出 线 。 从 右边 来 的 4 条 ALU 线 驱 动 一 个 4x 16 译 码 器 。 来 回忆 一 下 根据 ALU 
输入 值 的 情况 ， 译 码 器 输出 线 中 的 一 条 将 会 为 1， 其 余 的 都 为 0。ALU 中 的 计算 单元 执行 
图 10-55 中 的 前 15 种 功能 ， 从 译 码 器 来 的 15 条 进入 计算 单元 输入 线 ， 其 中 的 每 一 条 都 使 能 
一 个 执行 对 应 功能 的 组 合 电路 。 

该 计算 单元 有 32 条 输入 线 : A 输 入 8 条 ,，B 输 入 8 条 ，Cin 一 条 ,来 自 译 码 器 的 15 条 。 
EA 10 条 输出 线 : 计算 结果 8 条 , 加 上 V 和 C 各 一 条 。N 和 2Z 位 的 计算 在 计算 单元 之 外 。 
在 图 10-56 中 可 以 看 到 NN 位 只 是 计算 单元 Result 最 高 位 的 一 个 副本 ，Z 位 是 Result 的 8 个 
位 的 NOR。 如 果 所 有 8 个 位 都 是 0， 那 么 NOR 门 的 输出 为 1 ; 如 果 其 中 之 一 或 者 更 多 的 输 
入 位 为 1， 那 么 NOR 门 的 输出 为 0， 这 正好 是 根据 计算 结果 设置 Z 位 的 条 件 。 

左下 的 方 框 是 一 组 12 个 双 输 入 的 复 用 器 ， 每 个 复 用 器 的 控制 线 连接 到 译 码 器 的 第 15 号 
线 。 这 个 控制 线 的 功能 如 下 : 

e 如 果 线 15 为 1， 则 从 左边 来 的 Result 和 NZVC 被 送 到 输出 。 
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e MRA 15 为 0， 则 从 右边 来 的 Result Al NZVC 被 送 到 输出 。 
来 看 看 图 10-56 如 何 计 算 图 10-55 的 最 后 一 个 功能 。 如 果 ALU 输 入 是 1111 (bin), ABA 
线 15 为 1， 从 左边 来 的 Result 和 NZVC 被 送 到 ALU 的 输出 。 但 是 在 图 10-56 中 可 以 看 到 
Result 左边 的 位 连接 到 0，NZVC 来 自 A 的 低 四 位 元 组 〈 半 字 节 )， 这 正 是 该 功能 要 求 的 。 


LE 





图 10-56 图 10-54 中 ALU 的 实现 


图 10-57 是 图 10-56 计算 单元 的 实现 。 它 由 一 个 A 单元 、 一 个 算术 单元 和 标号 为 逻辑 单 
元 5 到 逻辑 单元 14 的 10 个 逻辑 单元 组 成 。A 单元 和 每 个 逻辑 单元 都 由 译 码 器 的 15 条 线 之 
一 来 使 能 。 任 何 单元 的 使 能 线 E 如 果 为 0， 那么 不 管 这 个 单元 的 其 他 输入 是 什么 ，Result、 
V 和 C 的 所 有 位 都 是 0。 算 术 单 元 负责 图 10-55 中 功能 1、2、3 和 4 对 应 的 算术 运算 的 
Result, V 和 C 的 计算 ， 相 应 的 控制 线 的 标识 分 别 为 4、e、f 和 g。 如 果 d、e、f 和 g 四 个 都 
为 0， 那 么 不 管 算术 单元 的 其 他 输入 是 什么 ，Result、V 和 C 的 所 有 位 都 为 0。 

计算 单元 的 每 个 输出 都 连接 到 一 个 12 输入 的 OR 门 。 此 OR 门 的 其 他 11 个 输入 是 其 他 
11 个 计算 单元 对 应 的 输出 线 。 例 如 ， 所 有 12 个 计算 单元 的 V 输出 送 到 一 个 OR 门 。 因 为 11 
个 计算 单元 都 一 定 是 未 使 能 的 ， 确 切 地 说 每 个 OR 门 的 11 个 输入 都 一 ER 0， 所 以 不 一 定 为 
0 的 输入 来 自 于 被 使 能 的 单元 。 因 为 0 是 OR BAW AIC 

pOR0 =p 

所 以 被 使 能 单元 的 输出 会 不 改变 地 通过 OR 门 。 

图 10-58 是 A 单元 的 实现 。 它 由 8 个 两 输入 AND 门 组 成 ,这些 门 是 8 位 A 信号 的 使 能 
门 。 图 10-55 表明 V 和 C 应 该 为 0， 因 此 V 和 C 输出 线 在 这 个 实现 中 都 是 0。 
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Result V C 
图 10-57 图 10-56 中 计算 单元 的 实现 


A 








图 10-58 图 10-$7 中 A 单元 的 实现 


图 10-59 是 算术 单元 的 一 种 实现 ， 它 是 图 10-53 的 加 法 器 /减法 器 电路 的 一 个 扩展 ， 修 








改 后 能 够 处 理 两 种 额外 情况 : 用 两 个 8 位 运算 来 实现 16 位 值 的 加 减 。 图 10-60 展示 的 是 怎 
样 用 两 个 8 位 运算 来 做 16 位 运算 。 图 10-60a 中 ，16 位 加 法 是 这 样 的 : 对 A 和 B 的 低 字 节 
执行 


A plus B 


然后 对 高 字 节 执行 


Aplus B plus Cin 


这 里 的 Cin 是 低 字 节 运 算 的 Cout。 图 10-60b 中 ，16 位 减法 是 这 样 的 : 对 A M B 的 低 字 节 执 行 


A plus B plus 1 


SR ea XT tea AAT 


A plus B plus Cin 
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这 里 的 Cin 同样 是 低 字 节 运算 的 Cout。 最 后 这 个 运算 同样 是 依据 在 硬件 上 实现 A 减 B 就 是 
把 A 加 上 B 的 补 。 低 字 节 运算 的 进位 是 加 法 的 进位 而 不 是 减法 的 ， 这 也 是 为 什么 电路 要 加 
上 而 不 是 减 去 低 字 节 运算 的 Cin 的 原因 。 


A7 B7 A6 B6 A0 BO 














Cout Cin 
S 





Result 
图 10-59 图 10-57 中 算数 单元 的 实现 
A<high> B<high> A<low> B<low> A<high> B<high> A<low> B<low> 


SA VO 


Aplus B A plus B plus Cin A plus B +1 
Cout 


Cout Cin 
S<high> S<low> D<high> D<low> 
a) 16 位 加 法 b) 16 位 减法 


图 10-60 ”用 两 个 8 位 运算 来 实现 16 位 运算 


例 10.38 下 面 讲解 硬件 怎样 处 理 239-261。259 (dec) 作为 一 个 16 位 数 ， 其 表示 为 
0000 0001 0000 0011， 因 此 A<high> = 0000 0001, A<low>= 0000 0011。261 (dec) 作为 
一 个 16 位 数 ， 其 表示 为 0000 0001 0000 0101, Alt B<high> = 0000 0001, B<low>= 0000 


0101。 低 字 节 相 加 是 
0000 001 1 
1111 1010 
ADD ] 
C=0 11111110 
高 字 节 相 加 是 
0000 0001 
11111110 
ADD 0 
C=0 11111111 
V=0 
最 终 的 差 是 1111 1111 1111 1110 (bin) = -2 (dec)， 和 预期 的 一 样 。 最 终 的 V 位 由 最 后 


的 进位 和 倒数 第 二 个 进位 进行 异 或 计算 得 出 ， 结 果 如 下 : 
















Aplus B plus Cin 


Cout Cin Cout 
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例 10.39 下 面 讲解 硬 件 怎样 处 理 261-259. XXK, A<high> = 0000 0001, A<low>= 


0000 0101, B<high> = 0000 0001, B<low>= 0000 0011。 低 字 节 相 加 是 


0000 0101 
1111 1100 
ADD l 


C= | 00000010 


高 字 节 相 加 是 
0000 0001 
1111 1110 
ADD I 


C = 1 0000 0000 
V=0 


最 终 的 差 是 0000 0000 0000 0010 (bin) = 2 (dec)， 和 预期 的 一 样 。 最 终 的 V 位 由 最 后 

的 进位 和 倒数 第 二 个 进位 进行 异 或 计算 得 出 ， 结 果 如 下 : 
1®1=0 口 
图 10-59 右上 部 分 的 控制 电路 框 控制 该 电路 的 功能 ， 图 10-61 是 它 的 真 值 表 。 将 这 个 框 
和 图 10-53 中 控制 加 法 器 /减法 器 电路 的 Sub 线 进行 比较 ， 当 加 法 器 /减法 器 中 的 Sub 为 0 
时 ，B 不 会 被 XOR 门 反 转 ， 低 字 节 位 计算 的 进位 是 0; 当 Sub 为 1 时 ，B 被 反 转 ， 低 字 节 
位 计算 的 进位 是 1。 这 两 个 功能 对 图 10-61 的 第 一 和 第 三 行 都 是 成 立 的 ， 第 二 行 用 于 高 字 节 

相 加 ， 最 后 一 行 用 于 高 字 节 相 减 。 

se | 
ApsB | i | o |f o | o | o | o | 
TEETE E 
oœ | o | o |i: | 1: | œ| 












A plus B plus 1 
A plus B plus Cin 


图 10-61 图 10-59 中 控制 电路 的 真 值 表 


从 理论 上 来 讲 ， 控 制 框 的 输出 Sub 和 C 是 de、f 和 g 的 函数 ， 然 而 通过 观察 真 值 表 可 
以 看 到 Sub 可 以 表达 为 

Sub = f+g 
C 可 以 表达 为 

C 一 e.Cin+g. Cin+f 
两 个 表达 都 和 d 无 关 。 

算术 单元 的 一 个 要 求 是 如 果 d、e、f 和 g 都 为 0， 那 么 不 管 其 他 输入 是 什么 ， 所 有 输出 
一 定 为 0。 图 10-59 中 四 输入 OR 门 的 输出 作为 使 能 信号 ， 当 d、e、f 和 8g 之 一 为 1 时 ， 它 
允许 该 单元 的 所 有 10 个 输出 通过 。 

逻辑 单元 5 一 14 的 实现 留 作 练习 。 因 为 普通 逻辑 门 就 能 实现 逻辑 运算 ， 所 以 它们 的 实 
现 很 简单 。 


10.4.8 LG1 层 的 抽象 
抽象 数据 类 型 (ADT) 是 HOL6 层 的 一 个 重要 设计 工具 。 其 思想 是 了 解 对 ADT 进行 操 
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作 的 函数 和 过 程 是 做 什么 的 ， 从 而 理解 ADT 的 行为 ， 而 不 必 知 道 它 们 是 怎样 做 的 。 一 旦 实 
现 了 一 种 运算 ， 可 以 不 理会 实现 细节 而 专注 于 解决 更 高 抽象 层级 上 的 问题 。 

相同 的 原理 在 硬件 层 上 也 适用 。 本 节 中 的 每 个 组 合 设 备 都 有 方块 图 和 真 值 表 来 描述 它们 
的 功能 。 方 块 图 之 于 硬件 就 像 ADT 之 于 软件 ， 它 是 一 种 抽象 ， 指 定 输入 和 输出 而 隐藏 实现 
细节 。 

硬件 中 更 高 层级 的 抽象 可 以 通过 构建 方块 图 定义 的 设备 获得 ， 这 些 方块 图 的 实现 是 更 低 
抽象 层级 方块 图 的 互联 。 图 10-50 是 个 完美 的 例子 ， 这 个 全 加 器 模块 用 图 10-51 AFAR 
块 来 实现 。 

硬件 的 最 高 抽象 层级 是 我 们 反复 看 到 的 Pep/8 计算 机 的 方块 图 。 它 有 四 个 模块 : 输入 设 
备 、CPU、 主 存 和 输出 设备 ， 它 们 之 间 用 总 线 相 连 。 在 稍 低 的 抽象 层级 ， 我 们 可 以 看 到 CPU 
中 的 寄存 器 ， 每 个 寄存 器 被 描绘 成 一 个 模块 。 后 面 两 章 将 逐步 扩展 到 更 高 的 抽象 层级 ， 直 到 
ISA3 层 的 Pep/8 计算 机 。 


总 结 


在 组 合 电路 中 ， 输 入 决定 输出 。 组 合 电 路 的 三 种 表示 方式 是 真 值 表 、 布 尔 代 数 表 达 式 和 
逻辑 图 。 这 三 种 表达 方式 中 ， 真 值 表 位 于 最 高 抽象 层级 ， 它 们 指定 电路 的 功能 而 不 指定 电路 
的 实现 。 真 值 表 列 出 了 输入 所 有 可 能 组 合 的 输出 ， 因 此 称 为 “组 合 电路 ”。 

布尔 代数 的 三 种 基本 运算 是 AND、OR 和 NOT。 布 尔 代 数 的 10 个 基本 属性 包括 5 个 定 
律 一 一 交换 律 、 结 合 律 、 分 配 律 、 恒 等 律 和 互补 律 以 及 它们 的 对 偶 属 性 ， 根 据 它 们 可 以 证 明 
出 很 有 用 的 布尔 定理 。 另 一 个 重要 的 定理 是 德 . 摩根 定律 ， 它 展示 了 怎样 对 几 个 项 的 AND 
或 OR 进行 NOT。 

一 个 布尔 表达 式 对 应 一 个 逻辑 图 ， 逻 辑 图 又 对 应 电子 门 的 连接 。 三 个 常见 的 门 是 
NAND (AND jA MER NOT), NOR (OR 后 面 跟 NOT) 和 XOR (exclusive OR)。 两 级 电路 可 
以 将 处 理 时 间 减 到 最 少 , 但 是 可 能 比 等 价 的 多 级 电路 需要 更 多 的 门 。 这 是 又 一 个 重要 的 空 
间 /时 间 折 中 的 例证 。 卡 诺 图 可 以 帮助 减少 实现 两 级 组 合 电 路 的 门 的 数量 。 

组 合 设备 包括 复 用 器 、 译 码 器 、 多 路 分 配器 、 加 法 器 和 算术 逻辑 单元 (ALU)。 复 用 器 
从 几 个 数据 输入 中 选择 一 个 传送 到 唯一 的 数据 输出 。 译 码 器 将 一 个 二 进 制 数 作为 输入 ， 将 几 
个 数据 输出 线 中 的 一 个 设 为 1， 其 余 的 设 为 0。 多 路 分 配器 把 几 个 数据 输入 值 中 的 一 个 传送 
到 唯一 的 输出 线 ， 逻 辑 上 等 同 于 一 个 有 使 能 线 的 译 码 器 。 半 加 融 实 现 的 是 两 个 位 的 相 加 ， 全 
加 器 是 三 位 相 加 ， 其 中 一 个 是 前 一 位 相 加 的 进位 。 减 法 器 的 工作 原理 是 对 第 二 个 操作 数 取 
反 ， 然 后 和 第 一 个 操作 数 相 加 。ALU 执行 算术 和 逻辑 功能 。 


练习 


10.1 F 

1. * (a) 用 布尔 代数 证 明 零 元 定理 x+ 1 = 1， 给 出 证 明 中 每 一 步 的 解释 。 提 示 : 用 互补 性 来 扩展 左边 
的 1， 然 后 使 用 寡 等 性 。(b) 给 出 (a) 中 的 对 偶 证 明 。 

2.(a) 用 布尔 代数 证 明 吸 收 属性 x+x .yy = 二 x， 给 出 证 明 中 每 一 步 的 解释 。(b) 给 出 (a) 中 的 对 偶 证 明 。 

3.* (a) 用 布尔 代数 证 明 合 意 定理 x.:y+x "z+y"*z=x*y+x’*z, 给 出 证 明 中 每 一 步 的 解释 。 
(b) 给 出 (a) 中 的 对 偶 证 明 。 

4. 用 书 中 证 明 的 对 偶 来 证 明 德 . 摩根 定律 (a + b) = a’* b'"， 给 出 证 明 中 每 一 步 的 解释 。 
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5. (a) 根据 两 个 变量 的 德 . 摩根 定律 ， 使 用 数学 归纳 法 证 明 德 . 摩根 定律 的 一 般 形 式 
(a; * a, * ...* An) ža +a +...+adn, Nn 二 2 
(b) 给 出 (a) 中 的 对 偶 证 明 。 
6.*(a) 用 布尔 代数 证 明 (x+y) (x'+y)=y， 给 出 证 明 中 每 一 步 的 解释 。(b) 给 出 (a) 中 的 对 偶 证 明 。 
7.(a) 用 布尔 代数 证 明 (x+y) (ys x’) =x+y， 给 出 证 明 中 每 一 步 的 解释 。(b) 给 出 (a) 中 的 对 偶 证 明 。 
8. * (a) 画 出 一 个 三 输入 OR 门 ， 它 的 布尔 表达 式 和 真 值 表 如 图 10-10 所 示 。(b) 用 三 输入 NAND 门 
来 实现 (a) 中 的 要 求 。(c) 用 三 输入 NOR 门 来 实现 (a) 中 的 要 求 。 
9. 用 集合 论 来 解释 下 面 的 布尔 属性 或 定理 : 
*(a)x+0=x (b)x°1l=x (c)x+x'=1 (d)x-x'=0 
(e)x°x=x (f)x+x=x (g)x-0=0 
10.* (a) Hx, y 和 z 的 重合 区 域 的 文 氏 图 来 说 明 OR 运算 的 结合 律 。 画 出 下 面 的 区 域 来 表明 区 域 (3 ) 
和 区 域 (6 ) 是 一 样 的 : 
(1)(x+y) (2)2 (3) (x+y)+z 
(4) x (5) (+x) (6) x+(y+z) 
(b) 给 出 (a) 中 的 对 偶 。 
11. (a) 用 x、y 和 z 的 重 倒 区域 的 文 氏 图 来 说 明 OR 运算 的 结合 律 。 画 出 下 面 的 区 域 来 表明 区 域 (3 ) 
和 区 域 (6 ) 是 一 样 的 : 
C1) 2 (2) yz (3) xt+y-z 
(4)(x+y) (5) (x +2) (6) (x +y). (r+2) 
(b) 给 出 (a) 中 的 对 偶 。 
12.(a) 用 a 和 的 重 亚 区 域 的 文 氏 图 来 说 明 德 :摩根 定律 。 画 出 下 面 的 区 域 来 表明 区 域 (2 ) 和 区 域 
(3) 是 一 样 的 : 
(l)a-b (2) (a: by (3) a (4) 2 (5) a +s’ 
(b) 给 出 (a) 中 的 对 偶 。 
13. 虽然 组 合 电路 的 一 个 布尔 变量 只 能 取 两 个 值 ， 但 是 布尔 代数 可 以 描述 变量 有 四 种 可 能 取 值 的 系统 ， 
这 四 种 可 能 的 取 值 是 : 0、1、A 和 B。 这 样 的 系统 对 应 于 {a, b} 的 子 集 的 描述 : 1 = {a,b} (SR), 
A = {a},B = {b}, T 0 = {}( 空 集 )。 二 输入 AND 和 OR 运算 的 真 值 表 有 16 个 表 项 而 不 是 4 个 ， 
求 补 的 真 值 表 有 4 个 表 项 而 不 是 2 个 。 构 造 下 述 运算 的 真 值 表 : 
*(a) AND (b) OR  (c) 求 补 
14. 异 或 NOR 门 ， 写 作 XNOR， 等 价 于 XOR 后 面 跟 一 个 反 相 器 。* (a) 画 出 二 输入 XNOR 门 的 符号 。 
(b) 构造 它 的 真 值 表 。(c) XNOR 也 称 作 比较 器 ， 为 什么 ? 
10.2 7 


15. 画 出 下 列 布尔 表达 式 的 非 简 略 逻辑 图 。 可 以 使 用 XOR 门 。 


了 (b) (((a’)')')’ 


*(c) a’b+ab’ (d) ab+a'b’ 
(e) ab+ab'+a'b (f) ((ab Bb') +a'by 
(g) (abe +a)b (h) (ab’c)'(ac)’ 
(i) ((ab)'(b'c)' +a'b'c'y' (j)(a@b+b' Gc’)! 
(k) (abc) + (a'b'c')’ (1) (a+b)(a’ + c)Xb' +c’) 
(m) (a @ b) @c+ab'c (n) ((a+b)' +c) +d)’ 
(0) (ab’ + b’c + cd)’ (p) (a+ b'\(b' +c\(c+d))' 
(q) (((ab)'c)'d)' (rt) (a @ b)' Go)’ ay’ 


16. 画 出 练习 题 15 中 布尔 表达 式 的 简略 逻辑 图 。 可 以 使 用 XOR 门 。 
17. 构造 练习 题 15 中 布尔 表达 式 的 真 值 表 。 
18. 写 出 图 10-62 中 逻辑 图 的 布尔 表达 式 。 
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c) 
图 10-62 练习 18 的 逻辑 图 


. 写 出 下 列 功能 或 门 的 AND-OR 布尔 表达 式 : 
* (a) 图 10-3 中 的 功能 y (b) 图 10-4 中 的 功能 y (c) 图 10-17 中 的 功能 x 
(d) 图 10-7a 中 的 NAND 门 ”(e) 图 10-7c 中 XOR 门 Y 
. 写 出 下 列 功能 或 门 的 OR-AND 布尔 表达 式 : 
* (a) 图 10-3 中 的 功能 y (b) 图 10-17 中 的 功能 x 
(c) 图 10-7b 中 的 NAND 门 ”(d) 图 10-7c 中 的 XOR TI 
. 使 用 布尔 代数 的 属性 和 定理 将 下 述 表 达 式 规约 为 不 带 括号 的 AND-OR 表达 式 。 得 到 的 表达 式 不 一 
定 是 唯一 的 。 根 据 最 终 得 到 的 表达 式 构 造 真 值 表 ， 这 是 唯一 的 。 


— 
\O 


2 


© 


2 


—" 


*(a)(a’b+ab’)’ (b)(ab+a'b’)' 
(c) (ab+ ab’ +a'b)’ *(d)(ab@b’)' + ab 
(e)(a’be+a)b ( f )(ab’c)'(ac)’ 
(g) (ab) Ge (h)aS(bSc) 
(i) (a+b)a’' +c)(b' +c’) (j )(a+b)' +c)’ 


22. 为 练习 21 中 的 表达 式 构 造 两 级 电路 ， 仅 使 用 NAND IJ. 
23. 使 用 布尔 代数 的 属性 和 定理 将 下 述 表 达 式 规约 为 不 带 括号 的 OR-AND 表达 式 。 得 到 的 表达 式 不 一 
定 是 唯一 的 。 根 据 最 终 得 到 的 表达 式 构造 真 值 表 ， 这 是 唯一 的 。 


(a)a'b+ab’ *(b)ab+a'b' 
(c)ab+ab'+a'b (d)((ab Bb') + ab)’ 
(e) (a'bc +a)b ( f ) (ab'c)'(ac)' 
(g)(a®b) Ge (h)a@®(b@c) 


(i) (a+b)(a’' +c)(b' +c’))’ (j)(a+b) +c 
24. 为 练习 23 中 的 表达 式 构造 两 级 电路 ， 仅 使 用 NOR 门 。 
25. 画 出 一 个 两 级 电路 的 逻辑 图 ， 实 现 XOR 功能 但 仅 使 用 下 述 门 : 
* (a) 仅 使 用 NAND 门 ”(b) 仅 使 用 NOR 门 
26. 说 明 图 10-63 中 的 每 个 门 是 不 是 下 面 的 门 : 
(1) AND 门 (2) ORT] (3) NAND 门 (4) NOR 门 


we 有 


图 10-63 练习 26 的 门 
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10.3 节 
*27. 用 西格玛 表示 法 写 出 练习 21 中 的 每 个 功能 。 
*28. 用 派 表 示 法 写 出 练习 23 中 的 每 个 功能 。 
29. 图 10-3 F, 找 出 下 述 最 小 AND-OR RAR: 
* (a) x(a,b,c) (b) y(a,b,c) 
仅 使 用 NAND 门 画 出 每 个 表达 式 的 最 小 两 级 电路 。 
30. 找 出 下 述 最 小 OR-AND 表达 式 : 
* (a)x(a,b,c) (b) y(a,b,c) 
仅 使 用 NOR 门 画 出 每 个 表达 式 的 最 小 两 级 电路 。 


31. 使 用 卡 诺 图 找 出 x(a, b, c) 的 最 小 AND-OR RAR: 
*( a ) 5(0, 4, 5, 7) (b)5(2, 3, 4, 6, 7) (ce) (0, 3, 5, 6) 
(d) S(O, 1, 2, 3, 4, 6) (e) (1, 2, 3, 4, 5) (f£) (1, 2, 3, 4, 5, 6, 7) 
(g) X(0, 1, 2, 4, 6) (h)5(1, 4, 6, 7) (i )¥ (2, 3, 4, 5, 6) 
(i) XO, 2, 5) 


*32. 用 派 表示 法 写 出 练习 31 中 的 每 个 表达 式 ， 并 确定 它 的 最 小 OR-AND 表达 式 。 
33. 使 用 卡 诺 图 找 出 x(a, b, c, d) 的 最 小 AND-OR 表达 式 : 


*(a)X(2,3,4, 5,10, 12, 13) 
(b) (1, 5, 6, 7, 9, 12, 13, 15) 
(c) (0, 1, 2, 4, 6, 8, 10) 
(d )5(7) 
(e) (2, 4,5, 11, 13, 15) 
(fH) FH.2, 4, 5, 67; 12, 15) 
{aj 2.4, 5,6, 7, 8, 11,12, 15) 
(h) (1, 7, 10, 12) 
(1)2 (0, 2, 3, 4, 5, 6, 8, 10, 11, 13) 
Cj )2 0; 1, 2, 3, 4, $, 6, 10, 11, 13, 14, 15) 
Ck) S10; 1, 2, 3,405.6, 7, 8,9, 10: 11, 12, 13, 14) 


*34. 用 派 表 示 法 写 出 练习 33 中 的 每 个 表达 式 ， 并 确定 它 的 最 小 OR-AND 表达 式 。 
35. 使 用 无 关 条 件 用 卡 诺 图 找 出 x(a, b, c, d) 的 最 小 AND-OR RER., 


*( a)5(0, 6) +d(1, 3, 7) (b) 2(5) + d(0, 2, 4, 6) 
(c) SC, 3) + d(O, 2, 4, 6) (d) 5(0, 5, 7) + d(3, 4) 
Ce) S(1, 7) + d(2, 4) (f) 5(4, 5, 6) + d(l, 2, 3, 7) 

36. 使 用 无 关 条 件 用 卡 诺 图 找 出 x(a, b, c, d) 的 最 小 AND-OR 表达 式 。 
*( a)5(5,6)+d(2,7,9, 13, 14, 15) 

(b) 5(0, 3, 14) + d(2, 4, 7, 8, 10, 11, 13, 15) 
(c) (3, 4, 5, 10) + d(2, 11, 13, 15) 

(d) x(5, 6, 12, 15) + d(0, 4, 10, 14) 

Ce) r(1, 6, 9, 12) + d(O, 2, 3, 4, 5, 7, 14, 15) 
(f) (0, 2, 3, 4) + d(8, 9, 10, 11, 13, 14, 15) 
(g) ¥(2, 3, 10) + d(0, 4, 6, 7, 8, 9, 12, 14, 15) 

37. (a) 三 变量 的 卡 诺 图 中 最 小 项 0 和 2 相 邻 、4 和 6 相 邻 。 复 制 一 份 图 10-30， 把 卡 诺 图 前 下 来 
并 围 成 圆柱 状 ， 使 得 相 邻 的 最 小 项 真正 相 邻 。(b) 要 想 使 四 变量 卡 诺 图 中 的 相 邻 最 小 项 实际 相 
邻 ， 需 要 一 个 三 维 的 圆 环 面 (形状 像 一 个 甜 甜 圈 )。 用 泥土 或 其 他 合适 的 材料 ， 在 上 面 刻 上 或 写 
上 图 10-33a 所 示 的 单元 和 十 进 制 标号 。 例 如 ， 标 号 为 2 的 单元 应 该 与 标号 0、3、6 和 10 的 单 
元 相 邻 。 

10.4 节 

38. 把 一 条 线 当 作 数 据 线 ， 另 一 条 当 作 控制 线 ， 解 释 下 列 二 输入 门 的 操作 

* (a) OR (b) NAND (c) NOR (d) XNOR 


XNOR 的 定义 参见 练习 14, 
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*40. 用 五 个 四 输入 复 用 器 构造 一 个 16 输入 复 用 器 。 把 16 输入 复 用 器 画 成 一 个 大 方 框 ， 有 16 条 数据 
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线 ， 标 号 为 D0 一 D1$， 还 有 4 条 选择 线 ， 标 号 为 S3 ~ S0。 在 这 个 大 方 框 里 ， 每 个 四 输入 复 用 
器 是 一 个 小 方 框 ， 数 据 线 为 D0 一 D3， 选 择 线 S1 和 S0。 画 出 实现 大 复 用 器 需要 的 从 小 方 框 到 外 
部 线路 的 连接 ， 以 及 方 框 之 间 的 连接 。 解 释 你 的 电路 是 如 何 运行 的 。 


.用 两 个 不 带 使 能 的 八 输入 复 用 器 以 及 任何 你 需要 的 其 他 门 来 完成 练习 40 的 要 求 。 解 释 你 的 电路 


是 如 何 运行 的 。 

* (a) 画 出 一 个 32X8 二 进 制 译 码 器 的 非 简略 逻辑 图 。(b) 画 出 一 个 带 使 能 的 2X4 二进制 译 码 器 
的 非 简略 逻辑 图 。 

用 五 个 带 使 能 的 2X4 二 进 制 译 码 器 构造 一 个 不 带 使 能 的 4X16 二 进 制 译 码 器 。 设 备 的 输入 
可 以 是 常数 1。 使 用 练习 40 的 画图 规则 对 外 部 和 内 部 线路 进行 标识 。 解 释 你 的 电路 是 如 何 运 
行 的 。 

用 两 个 带 使 能 的 3X8 二 进 制 译 码 器 和 任何 需要 的 其 他 门 构造 一 个 不 带 使 能 的 4X16 二 进 制 译 码 
器 。 使 用 练习 40 的 画图 规则 对 外 部 和 内 部 线路 进行 标识 。 解 释 你 的 电路 是 如 何 运 行 的 。 


.实现 一 个 如 图 10-47 所 示 的 带 使 能 的 2X4 二 进 制 译 码 器 。 画 出 你 的 电路 的 非 简 略图 。 


* (a) HA 10-51 中 全 加 颖 的 实现 ， 给 出 半 加 器 的 AND 和 XOR 门 。* (b) 从 输入 到 输出 最 大 
的 门 延 迟 数 是 多 少 ?(c) 根据 图 10-50b MAA, Wit Sum 和 Cout 的 最 小 二 级 网 络 。(d) 将 (c) 
的 设计 与 (a) 的 设计 进行 比较 ,计算 门 的 数量 和 处 理 时 间 的 变化 百分比 。 计 算 结 果 如 何 说 明 空 
间 /时 间 的 折 中 问题 ? 


.(a) 画 出 图 10-52 的 电路 ， 包 括 半 加 器 的 XOR、AND 和 OR 门 。* (b) 从 输入 到 输出 最 大 的 门 延 


迟 数 是 多 少 ?” 假设 XOR 门 需 要 一 个 门 延迟 。 这 个 问题 需要 仔细 思考 。 虽 然 该 电路 的 进位 是 波浪 
式 前 进 的 ， 但 还 是 假设 所 有 八 个 输入 都 同时 出 现 。 şai 


修改 图 10-52b， 增 加 两 个 输出 : N 位 和 Z 位 。 fe 
实现 一 个 带 选 择 位 S$ 的 四 位 ASL 移 位 器 ， 输 入 为 A3 A2 

Al A0， 它 代表 一 个 数 ，A0 是 LSB，A3 是 符号 位 。 则 输出 OO 
是 B3 B2 B1 BO 和 进位 位 C。 如 果 $ 为 1， 则 输出 是 输入 的 s 


ASL; WR Ss 为 0， 则 输出 与 输入 一 致 ，C 为 0。 图 10-64 练习 51 的 框图 


. 为 四 位 ASR 移 位 器 完成 练习 49 的 要 求 。 
.图 10-64 的 方块 图 是 一 个 三 输入 二 输出 的 组 合 开关 电路 。 如 果 s 为 0， 则 输入 a BRK x, DK 


到 y; 如 果 s 是 1， 则 两 者 交换 ，a 送 到 y,b 送 到 x。 只 用 AND, OR 和 反 相 器 构造 该 电路 。 


.图 10-65 中 的 方块 图 是 一 个 四 输入 二 输出 的 组 合 开 关 电 路 。 如 果 sl s0 = 00, 输入 a 广播 到 x 和 


y; 如 果 sl s0 = 01， 则 输入 5 广播 到 x Aly; WR sl1 s0 = 10, 则 a 和 4 直接 通过 到 x 和 y; 如 果 
sls0= 11， 则 a 和 4b 交换 ,a 送 到 y, b 送 到 x。 只 用 AND、OR 和 反 相 器 构造 该 电路 。( a) 使 用 
卡 庄 图 构造 最 小 的 AND-OR 电路 。(b) 使 用 卡 诺 图 构造 最 小 的 OR-AND 电路 。 


sl s0 = 00 sl s0 = 01 sl s0= 10 sl s0=11 
a - x a a g x 
Dien y b y Ds 》 
sl sO sl sO 





图 10-65 练习 52 的 框图 


53. 画 出 图 10-56 的 12 个 二 输入 复 用 器 ， 给 出 所 有 输入 到 输出 到 连接 线 。 可 以 用 省 略 号 (… ) 表示 八 


条 数据 线 中 间 的 六 条 。 


54, 实现 下 面 这 些 Pep/8 ALU 的 逻辑 单元 : 


(a ) 逻辑 单元 5,A.B (b) 逻辑 单元 6,A*B 
(c ) 逻辑 单元 7,A+B (d) 逻辑 单元 8, A+B 
(e ) 逻辑 单 元 9,A@B ` (f) 逻辑 单元 10, A 

(g ) 逻 辑 单元 11, ASL A (h) 逻辑 单元 12, ROL A 
(i) 逻辑 单元 13. ASR A (j) 逻辑 单元 14, ROR A 


55. 画 出 图 10-59 中 五 输入 二 输出 控制 框 的 实现 。 
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第 10 章 讨论 了 组 合 设备 ， 它 们 在 计算 机 设计 中 很 常用 。 尽 管 如 此 ， 仅 把 组 合 电路 互联 
起 来 是 不 可 能 构造 出 哪怕 最 小 的 计算 机 的 。 在 所 有 提 到 的 组 合 设备 中 ， 输 出 只 取决 于 输入 。 
当 输 入 改变 时 ， 只 需要 几 个 门 延 迟 点 时 间 ， 输 出 就 会 发 生 改 变 。 

电路 的 状态 (state) 是 时 序 电 路 区 别 于 组 合 电 路 的 特性 ， 时 序 电 路 能 记 住 它 处 在 什么 状 
态 ， 换 句 话 说 就 是 它 有 记忆 。 时 序 电路 的 输出 不 仅 取决 于 输入 也 取决 于 它 的 状态 。 

本 章 讲 述 怎样 构建 基本 的 时 序 元 件 ， 以 及 怎样 连接 它们 以 在 更 高 抽象 层级 上 形成 有 用 的 
块 ， 最 后 讲述 一 些 设备 ， 在 下 一 章 中 会 把 这 些 设备 连接 起 来 构成 Pep/8 计算 机 。 


11.1 Shae AN RI Sh AR Ae ae 


时 序 设备 由 在 第 10 章 中 讲述 的 同样 的 门 构成 ， 不 过 它 有 一 种 不 同 的 连接 方式 一 一 反馈 
(feedback)。 在 组 合 电路 和 描述 它们 的 布尔 表达 式 中 ， 每 个 门 的 输出 会 连接 到 之 前 未 连接 过 
的 门 的 输入 。 然 而 ， 反 馈 连接 会 形成 回路 或 环 路 ， 一 个 或 多 个 门 的 输出 “反馈 ”到 电路 中 前 
面 的 门 的 输入 。 

图 11-1 展示 的 是 两 个 简单 的 有 反馈 连接 的 电路 。 图 11-1a 
是 一 串 三 个 反 相 器 ， 反 馈 到 第 一 个 反 相 器 的 输入 。 要 分 析 这 个 “一 “ ni 
电路 的 行为 ， 假 定 d 点 的 值 为 1。 由 于 反馈 回路 把 4 连接 到 了 ”一 个 个 稳定 的 电路 
a 点 ， 因 此 a 点 的 值 一 定 也 是 1。 一 个 门 延 迟 后 ,b 点 的 值 一 定 
为 0 (尽管 为 了 简便 起 见 我 们 在 前 面 忽略 了 反 相 器 的 延迟 ， 但 
在 这 个 电路 里 必须 要 考虑 延迟 ) 。 再 经 过 一 个 门 延迟 后 ，c 点 将 “ 
为 1， 在 第 三 个 门 延 迟 后 ，4 将 为 0。 ll iain 

现在 的 问题 是 分 析 开 始 时 ， 我 们 假设 4d 点 为 1， 现 在 它 。 图 11-1 简单 的 反馈 电路 
变 为 0， 经 过 三 个 门 延迟 后 ， 它 又 变 成 了 1。 这 个 电路 会 振荡 ， 每 隔 几 个 门 延 迟 ， 电 路 中 
每 个 点 的 值 会 在 1 和 0 之 间 来 回 变换 。 仅 能 保持 几 个 门 延 迟 时 间 不 变 的 状态 称 为 非 稳 态 
(unstable state ) 。 

图 11-1b 中 ， 如 果 假 定 c 点 的 值 为 1， 那 么 a 点 将 为 1, 5b 将 为 0, c 将 为 1， 这 和 开头 
的 假设 是 一 致 的 。 这 样 的 状态 是 稳定 的 ， 电 路 中 所 有 的 点 将 永久 地 保持 它们 的 值 。 

另 一 种 可 能 的 稳 态 是 点 c 和 ea 的 值 为 0, b 为 1。 如 果 构 建 这 样 的 一 个 电路 ， 它 会 处 于 
哪 种 状态 呢 ?。 点 会 是 0 还 是 1 呢 ? 和 所 有 电子 设备 一 样 ， 门 需要 一 个 电源 打开 才能 运行 。 
如 果 构 建 图 11-1b 的 电路 并 打开 它 ， 它 的 状态 会 随机 建立 。 打 开 电 路 时 ，c 点 有 一 半 的 机 会 
为 0， 一 半 的 机 会 为 1。 电 路 会 一 直 保 持 电源 打开 时 建立 的 那 种 状态 。 


11.1.1 SR 锁 存 器 


为 了 实用 ,时序 设备 需要 一 种 设置 状态 的 机 制 。 图 11-2 的 SR 锁 存 器 (SR latch) 就 是 
这 样 一 种 设备 。S 和 及 是 它 的 两 个 输入 ， 它 的 两 个 输出 是 Q AO GEE Q bar)。 两 个 反馈 连 
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接 是 从 Q 到 下 面 NOR 的 输入 以 及 从 9 到 上 面 NOR 的 输入 。 
来 看 看 稳 态 的 可 能 性 ,假定 S 和 R 都 是 0，Q 也 是 0。 下 面 门 的 两 个 输入 都 是 0， 这 使 


得 为 1。 上 面 NOR 的 两 个 输入 为 0 (R) 和 1 (Q). KEM NOR 的 输出 是 0， 这 和 我 们 


开头 对 Q 的 假设 是 一 致 的 ， 因 此 当 SR = 00 时 ，QQ=01 是 稳 态 。 
从 这 个 稳 态 开始 ， 思 考 一 下 如 果 将 输入 S 变 为 1 会 发 生 什 么 。 图 11-3 概括 了 这 个 事件 
FJI Te 表示 一 个 门 延迟 的 时 间 间 隔 ， 通 常 是 2ns。 


R 





图 11-2 SR 锁 存 器 图 11-3 SR 锁 存 器 中 将 S 变 为 1 


在 时 间 0，S 变 为 1， 这 使 得 下 面 门 的 两 个 输入 变 为 1(S) 和 0 (Q)。 一 个 门 延 迟 后 ， 
这 个 变换 的 影响 传送 到 Q，Q 变 为 0。 现 在 上 面 门 的 两 个 输入 为 0 (R) 和 0 (Q)。 再 经 过 一 
个 门 延 迟 后 ， 上 面 门 的 输出 变 为 1。 现 在 下 面 门 的 两 个 输入 为 1(S) 和 1 (Q)， 这 使 得 其 输 
出 为 0。 

不 过 下 面 门 的 输出 已 经 为 0， 因 此 没有 变化 。 因 为 沿 着 反馈 连接 跟踪 得 到 一 致 的 值 ， 所 
以 最 后 一 个 状态 是 稳定 的 。 图 11-3 的 中 间 两 个 状态 是 不 稳定 的 ， 因 为 它们 仅 持 续 了 几 个 门 
延迟 的 时 间 。 

如 果 把 S 改 回 0 会 怎么 样 呢 ? 图 11-4 展示 了 这 个 
事件 序列 。 下 面 门 的 两 个 输入 为 0(S) 和 1 (Q), AA 
它 的 输出 为 0。 它 已 经 为 0 了， 电路 中 也 没有 其 他 变化 ， 
所 以 该 状态 是 稳定 的 。 图 11-4 SR 锁 存 器 中 将 S 变 回 0 

从 图 11-3 和 图 11-4 可 以 看 到 ， 当 SR 锁 存 器 处 于 稳 态 时 ，Q 总 是 Q 的 补 。 上 面 加 一 横 
是 补 的 另 一 种 常用 的 符号 ， 等 同 于 第 10 章 中 使 用 的 一 撤 的 符号 表示 。 

将 图 11-3 中 第 一 个 状态 和 图 11-4 中 最 后 一 个 状态 进行 比较 可 以 看 到 ， 两 种 情况 中 SR 
都 等 于 00, 但 是 第 一 种 情况 的 输出 是 Q = 0， 第 二 种 情况 的 输出 是 Q = 1。 输 出 不 仅 取决 
于 输入 ， 也 取决 于 锁 存 右 的 状态 。 

S 变 为 1 又 变 回 0 的 效果 是 将 状态 设置 为 Q = 1。 如 果 锁 存 器 以 SR = 00 和 状态 Q = 1 
开始 ， 那 么 通过 类 似 的 分 析 可 以 看 到 把 R 变 为 1 又 变 回 0 将 会 把 状态 重 置 为 Q = 0。S 表示 
设置 ，R 表示 重 置 。 

SR 锁 存 器 类 似 于 墙 上 的 电灯 开关 。 将 S 变 为 1 再 变 回 0 就 像 把 开关 推 上 打开 电灯 ， 将 
R 变 为 1 再 变 回 0 就 像 把 开关 拉 下 。 如 果 开 关 已 经 是 打开 状态 ， 那 么 再 尝试 打开 它 时 不 会 发 
生 什 么 改变 ， 开 关 仍 然 是 打开 状态 。 类 似 情 况 ， 如 果 Q 已 经 是 1 了 ,把 S 变 为 1 再 变 回 0 
时 状态 不 会 改变 ，Q 仍然 为 1。 

一 般 情 况 下 SR 锁 存 器 的 输入 情况 是 SR = 00。 要 设置 或 重 置 锁 存 器 ， 就 要 把 S$ 或 者 
R 变 为 1 再 变 回 0。 通常 S 和 RR 不 会 同时 为 1， 如 果 S 和 RR 都 是 1， 那 么 Q 和 Q 就 会 都 为 
0，Q 将 不 是 Q 的 补 。 此 外 ， 如 果 将 SR = 11 同时 改 为 SR = 00， 那 么 锁 存 器 的 状态 是 不 可 
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预知 的 。 一 半 的 可 能 是 QQ = 01, 一 半 的 可 能 会 是 QQ = 10。 实 际 中 不 会 出 现 SR = 11 的 
情况 。 

时 序 图 (timing diagram) 是 时 序 电 路 行为 的 图 形 化 表示 。 图 11-5 是 一 个 时 序 图 ， 它 展 
示 了 输出 Q 和 Q 随 输入 S MIR 的 改变 而 改变 ， 横 轴 是 时 间 ， 纵 轴 是 电压 ， 高 电 平 为 1， 低 
电 平 为 0。 


图 11-5 SR 锁 存 器 的 时 序 图 


从 这 个 时 序 图 中 我 们 可 以 看 到 初始 状态 Q = 0， 在 时 间 点 a，S 变 为 1，Q 马上 被 设置 
为 1，Q 被 设置 为 0。 图 中 显示 变化 是 同时 发 生 的 。 就 像 前 面 分 析 的 一 样 ，Q 将 在 S 改变 一 
个 门 延迟 的 时 间 之 后 才 会 变化 ，Q 将 在 这 之 后 一 个 门 延迟 的 时 间 再 变化 。 这 张 时 序 图 假设 的 
时 间 比 例 尺 太 大 ， 不 能 展示 出 像 门 延迟 这 样 短 的 时 间 间 隔 。 

当 S 变 回 0 时， 状态 不 改变 。 在 时 间 点 bp，R 变 为 1 时 ，Q 重 置 为 0。 当 S 在 时 间 点 c 
又 变 为 1 时 ，Q 被 设置 为 1。 在 时 间 点 4，S 从 0 变 为 1， 这 不 会 改变 锁 存 器 的 状态 ， 因 为 Q 
已 经 是 1 了。 在 图 中 所 有 点 处 Q 都 是 Q 的 反 。 

图 11-5 中 显示 的 转移 是 瞬间 完成 的 ， 而 现实 中 没有 什么 可 以 不 耗 时 就 发 生 。 如 果 放 大 
时 间 比 例 尺 ， 转 移 将 会 呈现 为 在 每 个 点 有 一 定 坡度 的 、 更 加 平缓 的 变化 。 可 以 把 时 序 图 中 同 
时 了 瞬间 的 转移 看 作 一 个 高 层级 的 抽象 ， 它 隐藏 了 低 抽象 层级 的 门 延 民 和 平缓 的 坡度 变化 。 


11.1.2 $h SR 触发 器 


计算 机 中 的 子 系统 由 许多 组 合 设 备 和 时 序 设备 组 成 。 每 个 时 序 设备 就 像 一 个 SR BF a, 
处 于 两 种 状态 之 一 。 当 计算 机 执行 冯 ，… 诺 依 曼 循环 时 ， 所 有 时 序 设 备 的 状态 随 着 时 间 而 改变 。 
要 以 有 序 的 方式 控制 这 一 大 堆 设 备 ， 计 算 机 就 要 维护 一 个 时 钟 ， 并 要 求 所 有 设备 同时 改变 它 
们 的 状态 。 时 钟 始 终 持续 生成 脉冲 序列 ， 如 图 11-6 所 示 ，Ck 表示 时 钟 脉冲 (clock pulse). 


eae aed 





Ck 
图 11-6 ”时钟 脉 冲 序列 


每 个 时 序 设备 除了 其 他 输入 外 ， 都 有 一 个 Ck 输入 。 设 备 仅 在 时 钟 脉冲 期 间 啊 应 它 的 输 
入 。 脉 冲 之 间 的 时 间 ， 图 中 用 了 表示 ， 是 时 钟 的 


周期 (period)。 周 期 越 短 ， 设 备 改变 状态 就 越 频 Q 
繁 ， 电 路 计算 速度 就 越 快 。 eT 

图 11-7 是 有 时 钟 输入 的 SR 锁 ， 叫 作 | Q 
触发 器 ( flip-flop). Plains deli s 
一 对 有 反馈 的 NOR 门 组 成 ， 不 过 SR 不 是 直接 Ck 
输入 到 NOR 门 ， 而 是 先 通过 两 个 作为 使 能 端的 ned ae 


AND 门 。 图 11-7a 是 方块 图 ， 图 11-7b 是 它 的 一 图 11-7 钟 控 SR 触发 器 
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种 实现 。 注 意 这 个 方块 图 使 用 的 惯例 是 把 S 放 在 方块 图 上 面 Q 的 对 面 ， 而 实现 中 S 在 QQ 的 
对 面 。 

在 Ck 为 低 电 平 期 间 ， 不管 S$ 和 R 的 值 是 什么 ，NOR 门 的 输入 都 为 0。 当 NOR 门 的 输 
人 为 0 时 ， 意 味 着 锁 存 器 不 会 改变 状态 。Ck 为 高 电 平 期 间 ，S 和 R 不 改变 地 通过 使 能 门 ， 
设备 按照 图 11-2 的 SR 锁 存 器 方式 运行 。 除 非 Ck 为 高 电 平 ， 否 则 AND 门 保护 NOR 门 免 
受 S 和 R 的 影响 。 图 11-8 给 出 了 这 个 设备 行为 的 时 序 图 ，Q 一 直 是 Q 的 补 ， 在 本 图 中 没有 
给 出 。 





图 11-8 钟 控 SR 触发 硕 的 时 序 图 


当 S 变 为 1 时 ， 这 个 改变 不 会 影响 Q， 因 为 时 钟 仍然 是 低 电 平 。 在 时 间 点 a 时 钟 变 为 高 
HOF, Ck 允许 SR = 10 Ñ AND], KAMAQ = 1。 稍 后 当时 钟 变 为 低 电 平 时 ，Ck 
禁止 SR 输入 锁 存 器 。 如 果 R 在 时 间 点 5 之 前 就 变 为 1， 这 不 会 影响 锁 存 絮 的 状态 。 只 有 在 
时 间 点 b, Ck 再 次 高 电 平时 ，R A AERA BFE aE. 

时 钟 为 高 电 平 时 ， 在 一 个 时 间 间 隔 内 ， 实 际 上 是 有 可 能 让 S AR 做 几 次 转移 的 ， 但 是 
现实 中 不 会 发 生 这 样 的 情况 。 电 路 的 主要 设计 思路 是 ， 把 SR 输入 设置 成 想 要 的 转移 ， 然 后 
等 待 下 一 个 时 钟 脉冲 。 当 时 钟 脉冲 到 来 时 ， 状 态 可 以 根据 S$ ALR 的 值 而 改变 。 时 钟 变 为 低 
电 平 之 后 ， 电 路 给 下 一 个 脉冲 准备 SR 值 。 

均匀 分 布 的 脉冲 使 任何 状态 改变 只 在 均匀 分 布 的 时 间 间 隔 发 生 。 图 11-8 的 S 和 R 输 
入 与 图 11-5 的 输入 一 样 ， 但 是 Q 中 相应 的 状态 变化 被 时 钟 改 变 了 。 时 钟 的 作用 就 是 使 时 间 
(时 序 图 的 横 轴 ) 数字 化 ， 同 电子 电路 使 电压 信号 〈 纵 轴 ) 数字 化 的 方法 一 样 。 就 像 信号 一 定 
或 者 为 高 电 平 或 者 为 低 电 平 而 绝 不 会 是 中 间 的 情形 一 样 ， 时 序 电 路 的 状态 改变 一 定 发 生 在 某 
个 时 钟 脉冲 或 男 一 个 时 钟 脉冲 一 一 绝 不 会 在 两 个 脉冲 之 间 。 


11.1.3 -JM SRRA 


TARA MAAS HEAT ACM Ck 进行 啊 应 ， 所 以 图 11-7 的 钟 控 触 发 器 称 为 电 平 敏 
ky (level sensitive)。 尽 管 这 个 设备 会 像 预 期 的 那样 遵循 时 钟 ， 但 是 它 有 一 个 严重 的 实际 
缺陷 ， 图 11-9 说 明了 这 个 问题 。 

此 图 展示 了 SR 设备 的 一 种 可 能 的 连接 情况 。 时 序 设备 的 输出 包含 一 个 穿 过 某 个 组 合 电 
路 的 反馈 环 ， 最 终 通 向 同一 时 序 设备 的 输 
入 ， 这 是 很 常见 的 。 图 中 有 一 个 三 输入 两 
输出 的 组 合 电路 ， 其 中 两 个 输入 是 SR 时 
序 设备 的 输出 反馈 。 这 个 反馈 环 同时 还 是 
NOR 门 的 反馈 ， 图 中 没有 在 SR 框 中 显示 
出 来 。 

想 一 想 如 果 SR 触发 器 是 电 平 敏感 的 会 图 11-9 SR 设备 的 一 种 可 能 的 连接 
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BEA. (REE SR Æ 10, QQ 是 01， 时 钟 是 低 电 平 。 因 为 时 钟 禁止 SR 进入 NOR 锁 存 器 ， 
所 以 $ 不 会 将 Q 设置 为 1。 现 在 假设 时 钟 变 为 高 电 平 ， 经 过 几 个 门 延迟 后 ，SR 将 Q 设置 为 1。 

现在 想 想 QQ 的 变化 ， 在 用 同样 的 外 部 输入 经 过 组 合 电路 后 ， 使 SR = 01。 如 果 Ck 仍 
然 为 高 电 平 ， 那 么 时 钟 将 允许 SR 的 值 再 经 过 几 个 门 延 迟 后 将 Q 重 置 为 0。 不 幸 的 是 ，QQ 
的 值 01 将 再 次 通过 组 合 电 路 ， 把 SR 变 为 10。 

你 应 该 认识 到 这 个 状况 是 不 稳定 的 。 每 过 几 个 门 延 迟 ， 只 要 时 钟 是 高 电 平 ， 时 序 设 备 的 
反馈 连接 就 使 得 SR 触发 器 改变 状态 。 时 钟 为 高 电 平时 ， 状 态 会 改变 成 百 上 千 次 。 当 时 钟 在 
脉冲 未 端 最 后 变 成 低 电 平时 ， 不 可 能 准确 预测 触发 絮 处 于 什么 状态 。 

因为 穿 过 组 合 电路 的 反馈 连接 对 于 构建 计算 机 子 系统 来 说 是 必需 的 ， 所 以 我 们 需要 时 
序 设备 不 仅 要 限定 在 时 钟 脉 冲 期 间 才 会 改变 状态 ， 而 且 要 避免 受到 反馈 连接 的 进一步 改变 。 
设备 需要 对 它 的 输入 在 极其 短 的 时 间 内 敏感 短 到 不 管 反馈 通过 组 合 电 路 并 改变 SR 有 多 
快 ， 这 个 改变 都 不 能 再 影响 触发 胡 的 状态 。 

设计 这 样 的 设备 有 两 种 技术 : 边沿 触发 和 主 -= 从。 边沿 触发 (edge-triggered) fh Atr 
会 在 时 钟 为 高 电 平 时 对 输入 敏感 ， 而 是 当时 钟 从 低 电 平 转移 到 高 电 平 时 对 输入 敏感 。 边 沿 触 
发 触发 器 的 实现 要 比 主 - 从 触发 器 更 难于 理解 ， 尽 管 它 是 两 种 技术 中 更 常用 的 ， 但 是 在 这 里 
我 们 不 进行 讲解 。 了 解 这 两 类 触发 器 都 解决 了 反馈 连接 引发 的 同样 的 问题 ， 这 就 足够 了 。 

图 11-10 展示 的 是 主 - 从 (master-slave) SR 触发 器 的 实现 ， 主 触发 器 和 从 触发 器 都 是 
电 平 敏感 的 钟 控 SR 触发 器 。 主 触发 器 (Q2) 的 Q 输出 连接 从 触发 器 (R2) WR BMA, E 
fi AC AS (Q2) 的 Q 输出 连接 从 触发 句 (S2) 的 S 输入，Ck 连接 主 触发 器 的 使 能 ，Ck 的 补 连 
接 从 触发 右 的 使 能 。 主 - 从 触发 器 的 方块 图 和 电 平 敏感 的 触发 硕 是 一 样 的 。 
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图 11-10 主 - 从 SR 触发 器 


主 触发 器 是 一 个 SR 触发 器 ， 因 此 Q2 和 Q2 将 会 一 直 互 为 补 。Q2 连接 从 触发 器 的 S2, 
Q2 连接 从 触发 器 的 R2， 那么 时 钟 到 达 从 触发 器 时 ， 将 根据 主 触发 器 的 状态 被 设置 或 者 重 
置 。 如 果 主 触发 器 处 于 状态 Q2= 1， 那 么 将 把 从 触发 器 也 设置 为 Q = 15 WIRE fh ab 
于 状态 Q2 = 0， 那么 将 把 从 触发 器 重 置 为 Q = 0。 使 用 主 - 从 这 个 术语 就 是 因为 时 钟 到 达 
从 触发 器 时 ， 它 会 接受 主 触 发 器 的 状态 。 

门 的 阅 值 (threshold) 是 刚好 能 导致 输出 变化 的 输入 值 。 要 使 主 - 从 电路 正确 地 工作 ， 
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= fh Ac a AY BB a AA EE Pe A RRR RAR AY BE V1 必须 小 于 主 使 能 门 的 立 
{H V2. 

图 11-11 展示 了 V1 和 V2 与 Ck 的 一 个 时 钟 脉冲 放大 
的 时 序 图 的 关系 。 时 钟 不 是 从 低 电 平 到 高 电 平 的 瞬时 转 
化 ， 而 是 逐步 增长 ， 首 先 在 时 间 点 ti 到达 V1， 接着 在 时 
间 点 到 达 V2， 最 后 到 达 高 电 平 。 在 下 降 的 过 程 中 ,在 ty ty tf 


号 


ae 
A 


时 钟 人 





时 间 点 Art V2， 在 时 间 点 4 经 过 V1。 时 间 
在 脉冲 开始 向 上 转变 前 ， 主 触发 器 是 禁止 输入 的 。 不 图 11-11 一 个 时 钟 脉冲 的 时 间 细节 


E SR 的 值 是 什么 ， 主 触发 右 将 保持 已 有 的 状态 。 因 为 从 触发 絮 输 入 是 使 能 的 ， 所 以 反 相 器 
确保 从 输入 连 到 主 触 发 需 ， 从 触发 需 一 定 处 于 和 主 触发 硕 相 同 的 状态 。 

随 着 时 钟 信号 的 上 升 和 下 降 ， 经 过 时 间 点 a, b, t Alt, RRO : 

o t: 将 从 触发 需 与 主 触 发 右 隔 离开 

e to: 主 触 发 需 连 接 到 输入 

o h: EALE ah Alia A TIF 

o ty: 将 从 触发 需 连 接 到 主 触发 需 
在 时 间 点 加 ， 信 号 达到 反 相 融 的 国 值 ， 使 反 相 需 的 输出 由 1 变 为 0。 从 触发 右 的 使 能 门 为 0， 
保护 从 触发 需 不 受 S2 和 R2 的 影响 。 不 管 从 触发 器 在 时 间 点 所 是 什么 状态 ， 它 都 保持 这 个 
状态 直到 Ck 超过 阔 值 V1。 

在 时 间 点 如 ， 信 号 达到 主 触发 锅 使 能 门 的 国 值 ， 使 主 触 发 器 对 SR 输入 敏感 。 如 果 SR 
是 10， 那 么 输入 将 会 把 主 触发 器 设置 为 Q2 = 1 ; 如 果 SR 为 01， 那 么 输入 将 重 置 主 触发 器 
为 Q2 三 0; 如 果 SR 为 00， 那 么 主 触发 器 的 状态 将 保持 不 变 。 如 果 主 触发 器 的 状态 不 变 ， 
那么 它 的 新 状态 就 不 会 影响 从 触发 需 ， 因 为 在 时 间 点 二 从 触发 锅 和 主 触 发 需 是 隅 离开 的 。 

思考 一 下 这 样 的 安排 是 怎样 让 触发 硕 免 于 受 图 11-9 的 反馈 连接 影响 的 。 这 个 反馈 基于 
从 触发 器 的 QQ 输出 ， 主 触发 器 的 输入 不 会 导致 它 发 生 改 变 。V1 小 于 V2 确保 了 在 主 触发 器 
变 为 对 输入 敏感 之 前 ， 从 触发 需 和 主 触发 器 是 分 离 的 。 就 算 穿 过 组 合 电路 的 门 延 迟 是 0， 反 
饶 也 不 会 影响 从 触发 需 的 状态 。 

当 Ck 从 高 电 平 转变 为 低 电 平时 ， 时 钟 在 时 间 点 t 到 达 V2。V2 是 主 触发 器 使 能 门 的 立 
值 ， 因 此 这 时 主 触 发 句 变 得 对 输入 敏感 。 因 为 V2 比 V1 大， 所 以 从 触发 器 仍然 免 受 主 触发 
fir HS) S o 

在 时 间 点 t, WAHA Ss ER PA ah A, MARARA MO ABA 1, ORE Sih Be a 
MEME. PE EAR A AIR AS EIT A , St AC RE AB SS BR SR hl EE I RAS AA fiih 
Betis FY HESS EAR AS 2 ASR A th Ac ais BY a Be ot BY) SE fh AC A A, aN a Weg BI) FE fk A 
做， 因为 在 时 间 点 ty SE ff Ac ai A fh Az a BS Sa A E Bia BS FY o 

= -从 电路 的 运行 大 致 类 似 于 宇宙 飞船 的 减 压 舱 。 在 飞船 内 ， 宇 航 员 不 需要 穿 太空 服 ， 
而 去 飞船 外 进行 太空 行走 则 要 穿 上 太空 服 进 入 有 两 个 门 的 减 压 舱 ， 这 两 个 门 初 始 是 关闭 的 。 

宇航 员 打 开 连 接 飞 船 和 减 压 舱 的 内 门 进入 减 压 舱 ， 然 后 关上 内 门将 减 压 舱 和 飞船 隔离 ， 
接着 打开 外 门 ， 减 压 舱 和 太空 就 连 上 了 ， 从 外 门 出 去 后 ， 再 将 外 门 关 上 。 在 任何 时 候 两 个 门 
不 会 同时 打开 ， 如 果 这 样 ， 飞 船 的 空气 就 会 全 部 泄漏 到 太空 里 。 

类 似 地 ， 主 - 从 电路 有 两 个 门 一 一 一 个 门 连接 或 隔离 主 触发 句 的 输入 ， 一 个 门 连接 或 隔 
离 从 触发 需 和 主 触发 右 。 在 任何 时 候 两 个 门 不 会 同时 打开 ， 即 主 触发 需 连接 输入 且 从 触发 需 
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连接 主 触发 器 。 如 果 同 时 打开 ， 反 馈线 路 会 在 电路 中 形成 不 稳定 的 状态 。 
图 11-12 是 主 -从 SR 触发 需 行 为 的 时 序 图 。 在 时 间 点 & 从 触发 器 连接 主 触发 器 ， 从 触 
发 大 的 状态 Q 发 生 改 变 ， 这 发 生 在 Ck 从 高 到 低 的 转变 时 期 。 





图 11-12 主 - 从 SR 触发 器 的 时 序 图 


由 于 触发 右 不 是 组 合 电路 ， 真 值 表 不 足以 刻画 它 的 行为 ， 取 而 代 之 的 是 特征 表 ( chara- 
cteristic table)， 它 说 明了 给 定 输 入 和 初始 状态 在 一 个 时 钟 脉 冲 后 的 状态 。 图 11-13 是 SR fh 
发 大 的 特征 表 。 

S(t) Al R(t) 是 在 时 钟 脉 冲 之 前 时 间 点 上 的 输入 ， 
Q(t) 是 在 时 钟 脉冲 之 前 触发 需 的 状态 ，Q( + 1) 是 脉 
冲 之 后 的 状态 。 从 这 个 表 可 以 看 出 ， 如 果 SR 为 00， 
那么 在 时 钟 到 达 的 时 候 ， 设 备 状 态 不 会 改变 ; 如 果 
SR 为 01， 设 备 设置 为 Q = 0; WR SR 为 10， 设 备 
设置 为 Q = 1。 如 果 时 钟 到 达 时 SR = 11, 那么 无 
法 预测 设备 是 什么 状态 。 

特征 表 实 质 上 是 一 个 状态 变换 表 ， 类 似 于 有 限 
状态 机 的 图 7-11。SR 触发 器 是 一 个 有 限 状 态 机 ， 有 
两 种 可 能 的 状态 ，Q = 0 和 Q = 1。 和 任何 有 限 状 图 11-13 SR 触发 项 的 特征 表 
态 机 一 样 ， 它 的 行为 可 以 用 一 个 状态 转移 图 来 表示 。 a 


图 11-14 是 SR 触发 器 的 状态 转移 图 。 o CEI CJ) 0 
国 图 表示 状态 机 的 状态 ， 贺 轿 里 是 Q 的 值 。 转 


移 用 引起 指定 转移 的 SR 值 标记 出 来 , 例如 从 Q=0 j 了 
到 Q = 1 的 转移 标记 为 SR = 10。 11-14 SR 态 





11.1.4 基本 触发 器 


下 面 是 计算 机 设计 中 篆 用 的 四 类 触发 需 : 

e SR 设置 / 重 置 

è JK 设置 / 重 置 / 反 转 

e D 数据 或 延迟 

e T 反 转 
前 面 一 节 介绍 了 怎样 构建 SR 触发 器 ， 它 的 特征 表 定 义 了 它 的 行为 。 其 他 三 种 触发 器 也 有 定 
义 其 各 自行 为 的 特征 表 ， 每 一 种 都 能 由 SR 触发 器 加 上 几 个 其 他 的 门 构成 。 像 SR 触发 器 一 
样 ， 其 他 触发 器 都 有 Q 和 马 输 出 。JK 触发 器 有 两 个 输入 ， 标 号 为 J 利 多 ， 而 不 是 $S AIR. 
D 和 T 触 发 器 都 只 有 一 个 输入 。 

从 SR 触发 器 构建 其 他 触发 器 有 一 个 系统 的 过 程 。 _ 般 电路 通常 包含 图 11-9 的 结构 ， 
SR 触发 器 的 输出 Q 和 Q 作为 构建 中 设备 的 输出 Q 和 Q。 对 于 区 触发 器 ,图 11-9 的 输入 线 
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实际 上 是 两 条 输入 线 ， REJ —ZRE K., XF D AAR, E— RAREN D, T 
触发 器 的 输入 标记 为 T。 要 设计 每 一 个 触发 器 ， 必 须 确 定 标记 为 组 合 电路 的 框 中 的 逻辑 门 和 
它们 的 互联 。 

和 任何 组 合 电 路 设计 一 样 ， 一旦 确定 了 真 值 表 形式 中 的 输 
路 。 因 此 ， 第 一 步 是 写 出 图 11-9 中 标记 为 组 合 电 路 的 方 框 所 需 Ch | a ft te | 
的 输入 和 输出 。 确 定 电 路 描述 的 一 个 有 用 工具 是 图 11-15 中 SR FERMES 
触发 器 的 激励 表 (excitation table), a| i [x fo. 

对 比 激励 表 和 图 11-13 的 特征 表 ， 特 征 表 告诉 你 给 定 当 前 
输入 和 状态 后 接 下 来 的 状态 是 什么 ， 但 激励 表 告诉 你 如 果 想 要 AIS SRRA 
得 到 某 种 转移 ， 当 前 的 输入 必须 是 什么 。 下 面 讲 述 根据 特征 表 怎 样 建立 激励 表 。 

表 中 第 一 个 条 目 是 Q 三 0 到 Q = 0 的 转移 ， 两 种 可 能 的 输入 SR = 00 和 SR = 01 允许 
这 种 转移 。SR 值 为 00 是 不 改变 的 条 件 ，SR 值 为 01 是 重 置 的 条 件 ， 这 两 个 条 件 都 会 使 触发 
器 做 出 从 Q = 0 到 Q = 0 的 转移 。 这 个 条 目 中 R(?) 下 面 的 “x ”是 一 个 无 关 条 件 的 值 ， 只 
要 $ 为 0, 不 必 关 注 R 值 是 什么 。 不 管 R 的 值 是 什么 ， 转 移 都 是 从 Q = 二 0 到 Q = 0。 

表 中 第 二 个 条 目 是 从 Q = 0 到 Q = 1 的 转移 ， 这 个 转移 发 生 的 唯一 方法 是 SR 的 输入 
为 10， 即 设置 条 件 。 类 似 地 ， 第 三 个 条 目 是 从 Q = 1 到 Q = 0 的 转移 ， 这 个 转移 只 有 在 
SR 值 为 01 时 才 会 发 生 。 

最 后 一 个 条 目 是 从 Q =1 到 Q= 1 的 转移 ， 人 允许 这 个 转移 的 两 种 可 能 的 输入 条 件 : 一 
个 是 SR = 00， 即 不 改变 条 件 ; 一 个 是 SR = 10， 即 设置 条 件 。 无 论 S EEA, WRR 
为 0， 那 么 这 个 转移 将 会 发 生 。SGD PRN “x” WHAT S 的 无 关 条 件 。 


11.1.5 JK fia ee 


JK 触发 器 解决 了 SR 触发 器 中 未 定义 的 转移 。J ARS 一 样 设置 设备 ， 玉 输入 像 R 一 
Pm eis. (AY IK = 11 时 ， 这 个 条 件 叫 作 反 转 条 件 。 反 转 意 味 着 从 一 个 状态 转移 到 另 
一 个 状态 。 在 反 转 条 件 下 ， 如 果 初 始 状态 为 0， 最 终 状 态 将 为 1 ;如果 初 始 状态 为 1， 最 终 
状态 将 为 0。 图 11-16 是 下 触发 器 的 方块 图 和 特征 表 。 


Ck 
十 | Q 


a) 方块 图 b) 特征 表 
图 11-16 JK 触发 器 
MF IK fA, K 11-9 中 标记 为 组 合 电路 的 方 框 有 三 个 输入 和 两 个 输出 。 输 入 是 十 、 
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K 以 及 来 自 反馈 连接 的 Q， 输 出 是 $S 和 R。 所 以 要 设计 两 个 三 输入 的 组 合 电 路 ， 一 个 用 于 

一 个 用 于 R。 首 先 ， 借 助 SR 激励 表 写 出 图 11-17 的 设计 表 。 

设计 表 告 诉 你 给 定 JK 触发 器 要 做 出 的 转移 时 ，SR 触发 右 必 需 的 输入 。 前 三 列 列 出 了 组 
合 电 路 的 三 个 输入 所 有 可 能 的 组 合 。JK 的 值 最 好 排序 ， 因 为 它们 会 显示 在 卡 诺 图 中 。 第 四 
列 是 时 钟 脉冲 之 后 的 Q 值 ， 每 个 Q(t + 1) 的 值 来 自 于 IK 触发 器 的 特征 表 。 例 如 ， 在 第 三 行 
中 下 =11， 这 是 触发 条 件 ， 所 以 初始 状态 Q(D = 0 反 转 为 Q(t + 1) = 1。 最 后 两 列 来 自 于 
给 定 Q(t) Al Q(t + 1) 的 SR 触发 侨 的 激励 表 。 例 如 ， 第 三 行 是 Q(7)Q(t + 1) = 01 的 转移 ， 激 
励 表 显示 要 实现 这 个 转移 ，SR 必须 为 10。 

下 一 步 是 写 出 这 个 函数 的 卡 诺 图 。 图 11-18a 中 的 条 目 来 自 于 设计 表 中 标号 为 SCD 的 那 
一 列 ， 图 11-18b 中 的 条 目 来 自 于 设计 表 的 R(?) 列 。 





b) R 的 卡 诺 图 





图 11-17 从 SR fh a foie JK 触发 器 的 设计 表 图 11-18 从 SR 触发 器 构造 JK 触发 器 的 卡 诺 图 


通过 检查 卡 诺 图 ， 可 以 写 出 S 的 最 小 AND-OR 表达 S = JQ, R 为 R= KQ。 图 11-19 
是 完整 的 设计 。 可 以 用 一 个 SR 触发 器 和 两 个 二 输入 ee ee 
AND 门 来 实现 JK fh O48. BRE IK Bra a REA (AAT 


以 看 出 这 个 设计 是 怎样 工作 的 。 如 果 JK = 00, HA i Q 
不 管 处 于 什么 状态 ，SR = 00， 这 个 状态 不 会 改变 ; k 
如 果 下 =11,Q=0, 那么 SR = 10，Q 将 变 为 1; Q 


如 果 初 始 Q = 二 1， 那么 SR = 01, Q 将 会 变 为 0。 
两 种 情况 下 状态 都 会 反 转 ， 对 JK = 11 也 是 同样 。 


你 应 该 也 能 分 析出 对 于 J = 01 和 = 10， 这 个 
电路 也 会 正常 工作 。 图 11-19 下 触发 器 的 实现 





Ck 


11.1.6 D 触发 器 


D 触发 货 是 一 个 除了 时 钟 之 外 只 有 一 个 输入 DD 的 数据 触发 器 ， 图 11-20a 是 它 的 方块 图 ， 
图 11-20b 是 它 的 特征 表 。 表 中 可 以 看 到 Q(t + 1) 与 Q() 无 关 ， 它 只 取决 于 在 时 间 点 上 的 D 
值 。D 触发 器 会 存储 该 数据 直到 下 个 时 钟 脉冲 。 图 11-20c 展示 的 是 时 序 图 。 这 个 触发 器 也 
叫 作 延 迟 触 发 器 ， 因 为 在 时 序 图 中 ，Q 的 形态 和 D 是 一 样 的 ， 只 是 有 一 个 时 间 延 迟 。 
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a) 方块 图 b) 特征 表 





c) 时 序 图 
图 11-20 D 触发 器 


要 从 SR 触发 需 构 建 一 个 D 触发 器， 首先 要 写 出 设计 表 。 因 为 除了 Q 以 外 只 有 一 个 输 
和信， 所 以 如 图 11-21a 所 示 ， 表 中 只 有 四 行 。 图 11-21b 和 图 11-21: 展示 的 是 卡 诺 图 ， 只 包含 
四 个 单元 而 不 是 八 个 。AND-OR 电路 的 简化 得 到 S = DAR = D., 


a Do 0 Re 





a) 设计 表 b) S 的 卡 诺 图 c) R 的 卡 诺 图 
图 11-21 从 SR 触发 器 构造 D 触发 器 的 设计 表 和 卡 诺 图 
图 11-22 Æ D 触发 器 的 实现 ， 除 了 SR 触发 器 ， 只 需要 一 个 反 相 器 。 这 个 实现 方法 没有 像 
JK 触发 器 的 实现 那样 有 来 自 Q 或 Q 的 反馈 连接 ， 这 是 因为 下 一 个 状态 不 依赖 于 当前 的 状态 。 
11.1.7 本 触发 器 


T 触 发 吉 是 一 个 反 转 触发 器 。 和 D 触发 右 一 样 ， 除 了 时 钟 外 ， 它 只 有 一 个 输入 TT。 
图 11-23a 是 方块 图 ， 图 11-23b 是 特征 表 。T 输入 就 像 一 条 控制 线 ， 指 明 是 否 进行 选择 性 反 
转 。 如 果 T 为 0， 触 发 器 不 会 改变 状态 ; 如 果 T 为 1， 触 发 器 反 转 。T 触发 器 的 实现 作为 章 


末 的 一 道 练习 题 。 
QD sft 


无 变化 







反 转 





a) 方块 图 b) 特征 表 
图 11-22 D 触发 器 的 实现 图 11-23 TÄLER 
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11.1.8 ”激励 表 


前 面 几 节 讲 述 了 怎样 用 SR 触发 占 和 其 他 门 构建 式 、D 和 T 触 发 器 ， 也 可 以 用 同样 的 
系统 化 过 程 从 其 他 触发 器 来 构建 任何 触发 器 。 这 看 上 去 好 像 没 什么 意义 ， 例 如 用 IK 触发 器 
来 构建 D 触发 器， 因为 最 开始 我 们 是 用 SR 触发 器 和 两 个 额外 的 门 来 构建 下 触发 器 的 ， 而 
只 需要 一 个 SR 触发 器 和 一 个 反 相 器 就 能 构造 出 D 触发 器 。 不 过 可 以 用 任意 触发 器 来 构建 其 
他 触发 器 这 一 事实 说 明了 所 有 触发 器 在 能 力 上 是 等 价 的 ， 即 用 某 种 触发 器 做 的 处 理 都 可 以 用 
其 他 触发 器 以 及 几 个 额外 的 门 来 实现 。 

例如 ,假定 有 一 个 开 触发 器 ， 想 构建 一 个 TT 触发 器 ， 那 么 就 要 从 TT 的 特征 表 和 区 的 
激励 表 写 出 设计 表 。 通 常 来 说 ， 要 从 触发 器 B 构建 触发 器 A， 需 要 A MEERA B 的 激励 
表 。 图 11-24 展示 的 是 了 下、D 和 T 触 发 器 的 激励 表 。 


ro fo 





po | oe fo 


a) JK 触发 器 b) D 触发 器 c)T 触 发 器 
图 11-24 下、D 和 T 触 发 器 的 激励 表 


我 们 应 该 验证 激励 表 的 每 个 条 目 。 例 如 IK 表 中 第 一 个 条 目 是 Q =0 到 Q=0 的 转移 。 
用 与 SR 触发 器 一 样 的 推理 ， 如 果 了 下 为 00 或 01， 就 会 发 生 该 转移 ; 因此 KO 下 面 是 无 关 
条 件 。 第 二 个 条 目 也 有 一 个 无 关 和 条件。 在 这 两 种 情况 下 会 发 生 从 Q =0 到 Q = 1%. IK 
可 以 为 10 设置 条 件 ， 或 者 为 11 反 转 条 件 ， 两 者 都 允许 Q 从 0 变 为 1。 


11.2 ”时 序 分 析 和 设计 


时 序 电 路 是 门 和 触发 器 的 互联 。 理 论 上 可 以 把 所 有 门 组 合 进 一 个 组 合 电 路 中 ， 把 所 有 触 
发 器 组 合 进 一 组 状态 寄存 器 (state register) F, WK 11-25 所 示 。 这 是 图 11-9 的 一 个 概括 ， 
它 只 包含 一 个 状态 寄存 器 ， 它 的 输出 不 需要 来 自 组 合 电 路 的 附加 的 门 。 

图 11-25 中 的 实 线 箭头 表示 一 条 或 多 条 连接 线 ， 输 入 和 输出 线 是 外 部 环境 到 电路 平台 的 
连接 ， 从 组 合 电 路 到 状态 寄存 器 的 连 线 是 到 SR、 下 、D 或 工 触 发 器 的 输入 线 ， 反 馈线 是 从 
触发 器 的 Q 和 Q 输出 到 组 合 电路 。 这 个 图 假设 状态 寄存 器 体 中 的 每 个 触发 器 都 使 用 一 个 通 
用 的 时 钟 线 (未 在 图 中 显示 )。 

在 时 钟 脉 冲 之 间 ， 电 路 的 组 合 部 分 根据 外 部 输入 和 电路 的 状态 形成 输出 ， 即 每 个 触发 器 
的 状态 。 产 生 组 合 电 路 输出 和 状态 寄存 器 输入 所 花费 时 间 的 多 少 取 决 于 电路 中 门 级 的 数量 。 
Ck 周期 被 调整 到 足够 长 ， 以 实现 在 下 一 个 时 钟 脉冲 之 前 允许 输入 通过 组 合 电路 直到 输出 。 
所 有 状态 寄存 器 都 是 边沿 触发 或 主 - 从 型 的 ， 以 防止 多 次 通过 反馈 回路 。 

和 图 11-14 一 样 ， 可 以 用 状态 转移 图 或 与 之 对 应 的 状态 转移 表 来 描述 一 个 通用 时 序 电路 
的 行为 。 不 同 之 处 在 于 图 11-14 是 一 个 有 两 种 可 能 状态 的 设备 ， 而 图 11-25 Æ n PHRASE. 
每 个 触发 髓 有 两 种 可 能 的 状态 ， 因 此 这 个 时 序 电路 总 共有 2” 种 状态 。 

硬件 层 的 分 析 和 设计 之 间 的 不 同 之 处 和 软件 层 一 样 。 图 11-26 说 明了 这 种 不 同 。 在 分 析 
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中 ， 输 入 和 时 序 电路 是 给 定 的 ， 要 确定 的 是 输出 ; 而 在 设计 中 ， 输 入 和 预期 的 输出 是 给 定 
的 ， 要 确定 的 是 时 序 电 路 。 


输入 





输入 





b) 设计 一 一 给 定 输入 和 期 望 的 输出 ， 要 确定 时 序 电 路 
图 11-25 通用 的 时 序 电 路 图 11-26 分 析 和 设计 的 区 别 


本 节 展 示 了 怎样 由 给 定 的 时 序 电路 和 输入 流 来 确定 输出 。 总 的 思路 是 根据 电路 构建 分 析 
表 ， 根 据 分 析 表 就 可 以 很 容易 地 确定 状态 转移 表 、 状 态 转移 图 和 针对 给 定 输入 流 的 输出 流 。 


11.2.1 ”时序 分 析 问 题 


假设 给 定 图 11-27 的 电路 ， 状 态 寄存 器 是 两 个 ”XI 
T 触 发 器 ， 标 识 分 别 为 FFA 和 FFB， 组 合 电 路 是 两 
A AND 门 和 一 个 OR 门 的 组 合 ， 输 入 为 XI 和 X2， 
唯一 的 输出 是 Y。 反 馈 回 路 包括 标识 为 A 从 FFA 的 
Q 发 出 的 线路 与 标识 为 B 和 百 两 条 从 FFB 的 Q 和 ~ 
Q 发 出 的 线路 。 到 FFA 的 输入 标识 为 TA， 到 FFB 
的 输入 标识 为 TB。 

因为 有 两 个 触发 器 ， 所 以 有 四 种 可 能 的 状态 

AB = 00 

AB = 01 

AB = 10 

AB = ii 
在 这 里 以 AB = 01 为 例 ， 它 意味 着 FFA 的 Q= 二 0 和 FFB 的 Q= 1。 有 两 个 输入 ， 因 此 有 
四 种 可 能 的 输入 组 合 

x1 x2 = 06 

Ki X2.= Gi 

X1 X2 一 -10 

Kix? =i! 

问题 来 了 。 给 定 一 个 初始 状态 AB 以 及 初始 输入 Xl M X2, (a) 初始 输出 是 什么 ? Cb) 一 
个 时 钟 脉冲 后 下 一 个 状态 将 会 是 什么 ?因为 有 四 种 状态 ， 每 个 状态 有 四 种 可 能 的 输入 组 合 ， 
所 以 需要 回答 这 些 问 题 16 遍 。 图 11-28 的 分 析 表 提供 了 一 种 回答 这 个 问题 的 系统 化 工具 。 

前 4 列 是 初始 状态 和 初始 输入 所 有 可 能 组 合 的 列表 。 根 据 图 11-27，Y(D)、TA(D 和 
TB(t) 的 布尔 表达 式 是 

Y(t) = X19 - BH 

TA(t) = X1(t) - B(t) 

TB(t) = X2(t) + A(t) 





图 11-27 待 分 析 的 电路 
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KIE, X1 7) A BO 7) AY Fh EFT AND 48) Y 7, X1 7) A BAO 7 É AND 得 到 
TA(?) Fi], X2(t) 列 和 A(?) 列 的 OR 得 到 TB(D 列 ， 根 据 T 触 发 器 的 特征 表 ， 触 发 器 的 初始 状 
态 和 它 的 初始 输入 可 以 计算 出 最 后 两 列 。 


II 





图 11-28 图 11-27 所 示 电 路 的 分 析 表 


例 11.1 来 看 一 下 B(L+ 1) 列 。 在 第 一 行 中 ， 根 据 BO 列 看 到 FFB 的 初始 状态 是 0， 从 
TB(t) 列 可 以 看 到 触发 器 的 输入 为 0。 根据 图 11-23b T 触 发 器 的 特征 表 ，0 是 无 关 条 件 ， 因 
此 状态 保持 一 致 ，B(t+ 1) 为 0。 LI 

例 11.2 同样 看 这 一 列 ， 来 看 第 二 行 。 根 据 BO 列 ，FFB 的 初始 状态 又 是 0， 这 次 根 
据 TB(t) 列 ， 触 发 器 的 输入 是 1。 根 据 T 触发 器 的 特征 表 ，1 是 反 转 条 件 ， 因 此 状态 反 转 ， 
B(t+1) 为 1。 口 

图 11-29 的 状态 转移 表 是 从 分 析 表 选 出 几 列 并 简单 重新 排列 的 结果 。 对 于 指定 的 初始 状 
AS AOBA) 和 指定 输入 X1(t)X2(t)， 它 列 出 了 接 下 来 的 状态 Alt + 1)B + 1) 和 初始 输出 Y(D。 
状态 是 一 个 有 序 对 ， 表 中 的 每 个 条 目 是 下 一 个 状态 ， 后面 跟 着 用 逗号 隔 开 的 初始 输出 。 

相 比 于 状态 转移 表 ， 通 常 状 态 转移 图 更 容易 表明 电路 的 行为 。 图 11-30 是 根据 状态 转移 
表 构 造 出 的 状态 转移 图 。 标 准 惯 例 是 用 有 序 对 来 标识 转移 ， 有 序 对 包括 输入 ,后 面 跟 痢 用 和 斜 
线 隔 开 的 初始 输出 。 

为 了 从 给 定 的 输入 流 确定 输出 ， 假 定 从 状态 AB = 11 开始 ， 输 入 下 面 的 X1 X2 值 : 

Ii, 11, 00; 10,70 
根据 状态 转移 图 ， 将 转移 到 如 下 的 状态 

11, 00, 01, 01, 11, 10 
并 产生 如 下 的 输出 

0, 1, 0, 0, 0 
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hd X1(#)X2(1) 





Xn) 
00/0, 01/0, 10/1, 11/1 


图 11-29 图 11-27 所 示 电 路 的 状态 转移 表 图 11-30 图 11-27 所 示 电 路 的 状态 转移 表 ， 
转移 被 标记 上 X1(t) XA / YA 


对 包含 其 他 触发 器 甚至 不 同类 型 触发 需 混 合 的 时 序 电 路 ， 分 析 也 是 类 似 的 。 使 用 组 合 电 
路 的 知识 ， 可 以 轻松 确定 输入 和 状态 所 有 可 能 的 组 合 下 ， 每 个 触发 需 的 输入 。 然 后 ， 根 据 每 
个 触发 器 的 特征 表 可 以 确定 接 下 来 是 什么 状态 。 通 稍 来 次 ， 如 打 有 六 个 输入 和 半 个 触发 硕 ， 
就 需要 分 析 2"2" 个 转移 。 


11.2.2 ” 预 设置 和 清除 


前 面谈 到 问题 的 输出 序列 假设 触发 需 都 是 在 Q = 1 这 个 状 
态 。 一 个 很 自然 的 问题 是 : 触发 器 怎样 进入 起 始 状态 呢 ? 实际 
上 大 多 数 触 发 需 都 有 两 个 额外 的 输入 ， 称 为 预 设置 (preset) 和 
清除 (clear)。 这 两 个 输入 是 异步 的 (asynchronous)， 即 它们 不 
依赖 于 函数 的 时 钟 脉冲 便 能 工作 。 图 11-31 展示 的 是 一 个 带 异 
步 预 设置 和 清除 输入 的 SR 触发 器 的 方块 图 。 

在 通常 的 运行 中 ， 预 设置 和 清除 线 都 是 0。 要 把 触发 锅 状 
态 初始 化 到 Q = 1， 就 要 把 预 设置 设 为 1 再 变 回 0; 要 把 触发 硕 
初始 化 为 0， 就 要 把 清除 设 为 1 再 变 回 0。 这 两 个 输入 中 任 一 个 图 11-31 带 异 步 预 设置 和 清 





只 要 为 高 电 平 就 能 起 作用 ， 不 需要 发 送 时 钟 脉冲 。 异步 预 设置 BRAY SR 触发 器 的 
和 清除 的 实现 作为 章 末 的 一 道 练习 题 。 方块 图 
11.2.3 时序 设 计 


采用 时 序 设计 ， 电 路 的 行为 常常 以 状态 转移 图 的 形式 给 出 ， 需 要 确定 如 何 用 最 少数 量 的 
门 来 实现 该 电路 。 同 时 ， 问 题 的 描述 中 也 会 给 出 时 序 电 路 中 使 用 的 状态 寄存 需要 采用 哪 种 类 
型 的 触发 全。 

设计 过 程 包括 三 步 。 第 一 步 ， 根 据 状 态 转移 图 将 电路 的 转移 制 成 设计 表 ， 对 于 初始 状态 
和 输入 的 每 种 组 合 列 出 初始 输出 和 下 一 个 状态 。 然 后 ， 根 据 激 励 表 列 出 导致 转移 所 需 的 触发 
能 输入 条 件 。 

第 二 步 ， 将 每 个 触发 絮 输 入 的 条 目 转移 到 卡 诺 图 。 如 果 在 设计 表 的 制 表 过 程 中 提前 考 
虑 ， 以 和 卡 诺 图 一 样 的 顺序 列 出 这 些 条 目 ， 将 有 助 于 防止 出 错 。 利 用 卡 庄 图 最 小 化 表达 式 ， 
设计 出 时 序 电 路 中 组 合 电 路 的 部 分 。 

第 三 步 ， 画 出 简化 后 的 组 合 电路 。 每 个 触发 器 的 输入 来 自 于 深度 最 多 为 两 个 门 级 的 组 合 
电路 。 可 以 把 这 个 过 程 看 作 是 由 SR 触发 需 构 建 瓦 、D 和 T 触 发 吉 过 程 的 一 般 性 概括 。 
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11.2.4 ”一 个 时 序 设 计 问 题 


这 个 例子 说 明 的 是 设计 过 程 。 问 题 是 要 用 SR 触发 器 实现 图 11-32 的 状态 转移 图 。 和 
图 11-30 一 样 ， 转 移 标 上 了 输入 值 X1 X2 和 初始 输 11/1 
出 Y。 状 态 圈 中 的 值 是 第 一 个 SR 触发 器 FFA 和 第 二 
个 SR 触发 器 FFB 的 Q 值 。 

这 个 机 器 只 有 三 种 输入 组 合 和 四 种 状态 ， 总 共 
12 种 转移 。 输 入 的 组 合 是 01、11 和 10。 由 于 组 合 
00 预期 不 会 发 生 ， 因 此 可 以 把 它 看 成 无 关 条 件 帮 助 
进行 最 小 化 。 

要 实现 有 八 个 状态 的 有 限 状态 机 需要 三 个 触发 器 ， 
实现 有 5 ~ 7 个 状态 的 机 器 也 需要 三 个 触发 器 ， 但 是 
有 些 状 态 是 预期 不 会 发 生 的 ， 可 以 看 作 无 关 状 态 。 图 11-32 ”一 个 设计 问题 的 状态 转移 图 

图 11-33 是 设计 过 程 的 第 一 步 。 左 边 四 列 是 初始 
状态 和 输入 所 有 可 能 的 组 合 ， 中 间 三 列 是 根据 图 11-32 得 出 的 初始 输出 和 下 一 状态 的 简 表 。 
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图 11-33 图 11-30 的 状态 转移 图 的 设计 表 


右边 有 四 列 是 因为 有 两 个 SR fh at, BER AR ACHE A Ta AA. SA Æ FFA 的 S 输 入， 
RA Æ FFA 的 R 输 入 ， 以 此 类 推 。 产 生 给 定 转移 的 触发 器 输入 条 件 来 自 图 11-15 的 SR 触发 
器 激励 表 。 

例如 ， 来 看 一 下 第 一 行 从 AB = 00 到 AB = 01 的 转移 。FFA 的 转移 是 从 Q = 0 到 Q = 0， 
从 激励 表 可 以 看 到 转移 由 S 为 0 和 R 为 无 关 条 件 引 发 。FFB 的 转移 是 从 Q 二 0 到 Q= 二 1， 从 
激励 表 可 以 看 到 这 个 转移 是 由 SR 为 10 导致 的 。 

下 一 步 ， 考 虑 每 个 触发 需 的 输入 是 一 个 四 变量 函数 一 一 初始 状态 、AB 和 输入 X1 X2。 
要 设计 这 个 组 合 电 路 ， 每 个 触发 右 输 入 需要 一 个 四 变量 卡 诺 图 。 图 11-34 是 根据 图 11-33 得 
出 的 卡 诺 图 ， 图 11-34a 是 输入 SA 的 卡 诺 图 ， 可 以 看 到 行 的 值 是 状态 AB， 列 的 值 是 输入 
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X1 X2。 请 注意 X1 X2 = 00 的 组 合 ， 卡 诺 图 第 一 列 是 无 关 条 件 。 





c) SB =B Xi d) RB =B X1 + A X2 e) Y = A X2 + A X1 X2 


K| 11-34 图 11-33 的 卡 诺 图 


输出 Y 也 是 一 个 初始 状态 和 输入 的 函数 ， 需 要 一 个 卡 诺 图 来 最 小 化 。 每 个 卡 诺 图 下 面 


是 它 对 应 的 最 小 化 表达 式 。 
图 11-35 是 设计 得 出 的 时 序 电路 。 这 个 图 是 个 简略 的 形式 ， 并 没有 画 出 反馈 连接 。 
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图 11-35 图 11-32 简化 的 时 序 网 络 
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完成 设计 后 ， 你 可 能 注意 到 图 11-34c 和 图 11-34d 中 ， 卡 诺 图 的 单元 8 是 被 覆盖 的 ， 所 
以 看 上 去 值 为 1。 而 图 11-34a 和 图 11-34b 没有 和 覆盖 这 个 单元 ， 所 以 它 的 值 看 上 去 为 0， 怎 
么 会 这 样 呢 ? 它 怎 么 会 同时 既 为 0 又 为 1 呢 ? 卡 诺 图 没有 展现 出 对 无 关 条 件 实际 上 会 发 生 什 
么 。 图 11-32 的 电路 描述 假设 外 部 输入 X1 X2 来 自 某 个 未 知 的 来 源 ， 组 合 X1 X2 = 00 EX 
际 中 绝 不 会 发 生 。 因 此 单元 8 代表 的 组 合 ， 即 AB XI X2 = 1000 绝 不 会 发 生 。 可 以 给 这 个 
组 合 选择 任何 你 想 要 的 电路 行为 方式 ， 因 为 它 根本 不 会 发 生 。 

如 果 需 要 设计 一 个 状态 数量 不 等 于 2 的 需 的 状态 机 ， 也 可 以 用 同样 的 方式 思考 。 比 如 说 
想 设 计 一 个 五 个 状态 的 状态 机 ， 两 个 触发 器 就 不 够 了 ， 因 为 它们 只 能 提供 四 个 状态 。 使 用 三 
个 触发 器 ， 可 能 有 八 种 状态 ， 但 实际 中 只 会 有 五 个 状态 发 生 ， 其 他 三 种 可 以 是 无 关 条 件 。 在 
设计 了 这 样 一 个 电路 后 ， 从 有 用 状态 不 能 到 达 无 用 状态 ， 但 反之 不 然 ， 即 可 能 有 从 无 用 状态 
到 有 用 状态 的 转移 ， 但 是 这 样 的 转移 是 无 关 的 ， 因 为 不 会 发 生 这 样 的 转移 ， 类 似 于 程序 中 的 
死 代 码 。 

这 个 例子 中 描述 的 设计 过 程 有 两 个 触发 器 和 两 个 输入 ， 卡 诺 图 中 总 共有 四 个 变量 。 设 计 
三 个 触发 器 一 个 输入 或 者 一 个 触发 器 三 个 输入 也 需要 四 变量 卡 诺 图 。 一 个 触发 器 两 个 输入 或 
者 两 个 触发 器 一 个 输入 的 设计 过 程 也 是 一 样 ， 只 不 过 用 三 变量 卡 诡 图 就 足够 做 最 小 化 了 。 

一 些 时 序 电路 需要 最 小 化 超过 四 个 变量 的 组 合 电路 。 卡 诺 图 不 能 很 方便 地 处 理 这 样 
大 小 的 问题 。 可 用 系统 化 过 程 处 理 此 类 问题 ， 其 中 最 常见 的 是 奎 因 - 麦克 拉 斯 基 ( Quine- 
McCluskey) 方法 ， 不 过 这 些 方法 都 超出 了 本 书 讨论 的 范围 。 | 


11.3 ”计算 机 子 系 统 


计算 机 是 一 组 互联 的 子 系统 ， 每 个 子 系统 是 一 个 黑 盒子 ， 有 定义 良好 的 接口 。 有 时 候 子 
系统 由 一 个 单独 的 集成 电路 组 成 ， 这 种 情况 中 接口 是 由 物理 封装 的 引 脚 的 运行 特性 描述 的 。 
在 更 低 的 抽象 层级 上 ， 这 个 子 系统 可 以 是 集成 电路 内 多 个 子 系统 的 一 部 分 。 或 者 在 更 高 的 抽 
象 层 级 上 ， 该 子 系统 可 以 是 一 个 印 制 电路 板 ， 由 几 个 集成 电路 组 成 。 

不 过 实际 上 子 系统 也 是 在 物理 上 实现 的 ， 总 线 把 各 个 子 系统 连接 在 一 起 。 总 线 可 以 是 一 
条 线路 ， 从 子 系统 的 一 个 门 的 输出 到 另 一 个 子 系统 的 一 个 门 的 输入 ， 或 者 它 也 可 以 是 包含 数 
据 和 控制 信号 的 一 组 线路 ， 就 像 图 4-1 Pep/8 中 连接 主 存 到 CPU 的 总 线 。 


11.3.1 寄存 器 


ISA3 层 机 器 的 一 个 基础 部 件 是 寄存 器 。 你 应 该 熟悉 Pep/8 CPU 中 的 16 位 寄存 器 ， 指 令 
集 包 括 操 控 寄 存 器 内 容 的 指令 。 图 11-36 展示 的 是 一 个 4 位 寄存 器 的 方块 图 和 实现 。 
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图 11-36 一 个 4 位 寄存 器 
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kh ay Fea AO ae A DS ea A— “Pi th Load 的 控制 输入 。 方 块 图 中 
用 一 个 宽 箭 头 表 示 四 个 数据 输入 线 ， 实 现 中 每 条 数据 线 是 单独 画 出 来 的 。 这 个 寄存 器 很 简 
单 ， 就 是 一 组 D 触发 器 ， 每 条 数据 输入 线 连 接 一 个 触发 器 的 D 输入 ， 每 条 数据 输出 线 连接 
一 个 触发 需 的 只 输出 ，Load 输入 连接 所 有 触发 硕 的 时 钟 输入 。 从 现在 开始 ， 用 阴影 来 表示 
包含 时 序 电 路 的 图 ， 以 区 别 于 组 合 电 路 。 

寄存 顺 的 运行 要 把 硕 望 加 载 的 值 放 到 数据 输入 线 上 ， 然 后 给 装载 信号 发 送 1 再 变 回 0， 
音 助 于 时 钟 把 数据 装 人 寄存 器 :所 有 四 个 值 同时 装 人 寄存 项。 如 果 每 个 触发 器 都 是 主 - 从 设 
备 ， 那 么 在 图 11-11 的 时 间 点 4 上， 当 从 触发 硕 连 接 到 主 触发 硕 时 ， 将 会 出 现 输出 。 

在 寄存 器 中 每 个 D fh are 1 位 。 一 个 8 位 寄存 项 有 8 个 触发 项 ， 一 个 16 位 寄存 部 有 
16 个 触发 右 。 触 发 右 的 数量 不 会 影响 装载 操作 的 速度 ， 因 为 每 个 触发 右 的 装 人 是 同时 发 生 
的 。 不 管 寄存 器 的 位 数 是 多 少 ， 它 的 方块 图 都 和 图 11-36a 所 示 的 一 样 。 


11.3.2 Be 


假设 两 个 子 系统 A 和 B 需要 来 回 发 送 数据 。 连 接 它们 最 简单 的 方法 是 用 两 条 单 向 总 线 : 
一 条 发 送 从 A 到 B 的 数据 ， 一 条 发 送 从 B 到 A 的 数据 。 第 一 条 总 线 是 一 组 线路 ， 每 一 条 线 
从 A 的 一 个 门 输出 到 B 的 一 个 门 输入 。 第 二 条 总 线 的 每 一 条 线 从 B 的 一 个 门 输出 到 A 的 一 
个 门 输入 。 

这 样 安排 的 问题 是 对 于 宽 总 线 来 说 线路 的 数量 太 大 。 如 果 想 同时 发 送 64 位 ， 就 需要 两 
条 单 向 总 线 ， 总 共 128 条 线路 。 若 使 用 双向 总 线 ， 这 个 数量 就 能 减 半 ， 但 损失 的 是 速度 。 用 
两 条 单 向 总 线 ， 可 以 同时 从 A 向 B 和 从 B 向 A 发 送 数据 ， 而 双向 总 线 则 不 可 能 做 到 。 如 果 
要 改变 总 线 上 数据 流 的 方向 ， 则 必须 在 发 送 数据 之 前 付出 一 小 段 建立 时 间 的 代价 。 

图 11-37 展示 了 实现 双向 总 线 必须 要 解决 的 问 子 系统 A 子 系统 B 
题 。AND 门 表 示 作 为 寄存 右 一 部 分 的 主 - 从 触发 
器 的 主 时 钟 使 能 门 ，NOR 门 代 表 另 一 个 寄存 器 的 
触发 器 的 从 Q 输 出门。 要 从 A 到 B 发 送 数 据 ， 那 
么 门 2 的 输出 必须 连 到 门 3 的 输入 。 从 B 到 A 发 . 
送 数据 ， 门 4 的 输出 必须 连 到 门 1 的 输入 。 问 题 PEIPOT acaba lhe 
出 在 门 2 和 门 4。 总 是 可 以 把 一 个 门 的 输出 连 到 另 一 个 门 的 输入 ， 但 是 不 能 把 两 个 门 的 输出 
连接 到 一 起 。 假 定 门 2 想 发 送 一 个 1 到 门 3， 但 同时 门 4 的 输出 刚好 为 0， 它 们 的 输出 是 冲 
突 的 ， 那么 哪 一 个 会 占 优 呢 ? 

答案 取决 于 底层 构造 门 的 技术 。 对 于 一 些 逻辑 门 族 ， 实 际 上 可 以 把 几 个 门 的 输出 连接 到 
一 起 ， 如 果 一 个 或 多 个 门 输出 1， 那 么 公共 的 总 线 将 传送 1。 由 于 总 线 上 的 信号 就 像 OR 门 
的 输出 ， 因 此 称 这 种 门 具 有 线 -OR 属性 ( wired-OR property)。 对 于 其 他 逻辑 门 族 ， 把 两 个 
门 的 输出 连接 到 一 起 会 使 电路 崩 演 ， 引 发 不 可 预知 的 灾难 。 即 使 线 -OR 门 也 仍然 存在 双向 
总 线 的 问题 。 例 如 ， 如 果 门 2 想 发 送 0 到 门 3, 但 是 此 时 门 4 的 输出 碰巧 是 1， 那 么 门 3 就 
会 错误 地 检测 到 一 个 1。 

为 了 使 双向 总 线 正常 工作 ， 需 要 找到 一 种 方法 ， 当 门 2 往 总 线 上 放 数 据 时 让 门 4 临时 与 
总 线 断 开 连 接 ， 反 之 亦 然 。 三 态 缓冲 器 可 以 精确 地 完成 这 个 工作 ， 它 有 一 个 数据 输入 ， 一 个 
使 能 控制 输入 和 一 个 输出 。 图 11-38 是 三 态 缓 冲 右 的 真 值 表 ， 这 里 的 E 是 使 能 控制 线 ，a 是 
输入 , x 是 输出 。 当 设备 使 能 时 ， 输 入 不 变 地 到 达 输 出 ; 当 设 备 禁 止 时 ,输出 实际 上 是 和 电 
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路 断 开 的 。 从 电子 学 角度 来 讲 ， 输 出 这 时 处 于 高 阻抗 的 状态 。 因 为 输出 可 以 有 三 种 状态 一 一 
0、1 和 断 开 ， 因 此 这 种 设备 叫 作 三 态 缓冲 器 。 

图 11-39 展示 的 是 三 态 缓 冲 器 怎样 解决 双向 总 线 问题 。 每 个 门 的 输出 和 总 线 之 间 有 一 个 
ZSR mMi BM A 到 B RKB, REA 中 的 三 态 缓冲 器 ， 禁 止 B 中 的 三 态 缓冲 器 ， 反 
之 亦 然 。 要 使 这 个 机 制 能 正确 发 挥 作用 ， 子 系统 必须 协调 工作 ， 不 能 让 它们 的 三 态 缓冲 器 同 
时 使 能 。 





图 11-38 三 态 缓 冲 器 的 真 值 表 图 11-39 使 用 三 态 缓冲 器 的 双 线 总 线 问 题解 决 方案 


11.3.3 ”内 存 子 系统 


内 存 子 系统 由 几 个 集成 电路 内 存 芯 片 构成 ， 图 11-40 展示 的 是 两 个 内 存 芯 片 ， 每 一 个 可 
以 存储 512 位 。 内 存 芯片 有 一 组 标记 从 A0 开始 的 地 址 线 ， 一 组 表 记 从 DO 开始 的 数据 线 ， 
一 组 标记 为 CS、WE 和 OE 的 控制 线 。 数 据 


线 有 两 个 箭头 ， 表 示 它 们 应 该 连接 到 双向 总 sm WF 

线 。 图 11-40a 表明 内 存 的 位 是 64 MALK AI <>p2 A 

字 。 图 中 有 6 条 地 址 线 ， 因 为 2=64, MA NO pd- A4 一 <>D 
值 的 每 种 可 能 组 合 会 访问 一 个 独立 的 8 位 字 。 A4 A> 

图 11-40b 展示 的 是 同样 数量 的 位 被 组 织 成 EEDE Aas 

512 个 一 位 的 字 。 图 中 有 9 条 地 址 线 ， 因 为 

2*-512。 一 般 来 说 ， 有 2 个 字 的 内 存 芯片 就 AA es 

A n 条 地 址 线 。 为 了 保持 例子 简单 ,， 图 11-40 a) 64 x8 位 内 存 芯片 b) 512 x 1 位 的 内 存 芯 片 


中 心 片 地 址 线 和 数据 线 的 数量 少 到 不 切实 际 ， 图 11-40 两 种 存储 512 位 的 集成 电路 内 存 芯片 
现在 制造 的 内 存 忌 片 都 有 上 亿 位 。 

控制 线 有 如 下 作用 : 

e CS (chip select， 心 片 选 择 ) 使 能 或 选择 内 存心 片 。 

è WE (write enable, SERE) 把 一 个 内 存 字 写 人 或 存储 到 芯片 中 。 

© OE (output enable， 输 出 使 能 ) 使 能 输出 组 神器 ， 从 芯片 读 取 一 个 字 。 
要 把 一 个 字 存 储 到 芯片 ， 就 要 把 地 址 线 设置 为 这 个 字 要 存储 的 位 置 ， 把 数据 线 设置 为 想 存 储 
的 值 ， 把 CS 设置 为 1 来 选择 这 个 芯片 ， 再 把 WE 设置 为 1 来 执行 写 人 。 从 芯片 中 读 取 一 个 
字 ， 要 把 地 址 线 设 置 为 要 读 取 的 地 址 ， 把 CS 设置 为 1 来 选择 该 芯片 ， 把 OE 设置 为 1 使 输 
出 使 能 ， 这 样 想 读 取 的 数据 就 会 出 现在 数据 线 上 了 。 在 实际 中 大 多 数 芯 片 的 控制 线 都 是 低 
电 平 有 效 的 ， 即 它们 平常 维持 在 表示 为 1 的 高 电 平 ， 把 它们 设置 成 表示 为 0 的 低 电 平 即 可 激 
活 。 为 了 例子 简单 ， 本 书 假定 内 存心 片 的 控制 线 为 高 电 平 有 效 。 

图 11-41 是 一 个 4X2 位 内 存心 片 的 实现 ， 它 有 两 条 地 址 线 和 两 条 数据 线 。 存 储 4 个 2? 
位 的 字 ， 每 位 是 一 个 D 触发 器 。 用 阴影 来 表示 时 序 设备 以 区 别 于 组 合 设 备 。 地 址 线 驱动 一 
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2X4 FSH, EMR A 1, KRESS AO, PRE 1 的 那 条 输出 线 选择 一 行 D 
AEAT, CAT fi Ac aie 2A GS BG Td A 





Al 11-41 一 个 4X2 位 的 内 存世 


标记 为 “ 读 使 能 ”的 方 框 提供 对 双向 总 线 的 接口 ， 图 11-42 是 它 的 实现 。DR 是 数据 读 
R, 来自 于 图 11-41 中 的 OR 门 ，DW 是 数据 写 和 人 线 ， 去 往 触 发 器 的 D 输入 ，D 是 到 双 办 
总 线 的 数据 接口 。 


图 11-43 是 这 个 电路 的 真 值 表 ， 芯 片 通常 是 下 面 三 种 模式 ON R 
Pa, OF 
e CS =0: HHAR RHP. 
e CS=1, WE=1, OE=0: ®HREPSA. D 
e CS=1, WE=0, OE=1: 芯片 被 选中 读 取 。 11-42 图 11-41 中 标记 为 “ 读 


不 允许 WE 和 OE 同时 都 为 1。 从 真 值 表 和 它 的 实现 可 以 看 使 能 ”的 方 框 的 实现 
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到 当 CS 为 0 时 ， 不 管 其 他 控制 线 如 何 , DR 总 是 从 双向 总 线 断 开 的 ; 当 CS 为 1、OE 为 0 时 ， 
DR 也 是 断 开 的 ， 这 就 是 写 人 模式 ， 这 种 情况 下 数据 从 双向 
总 线 送 到 DW ; 当 CS 为 1、OE 为 1 时， 三 态 缓冲 器 是 使 
能 的 ， 数 据 从 DR 送 到 双向 总 线 。 

来 看 一 下 内 存 读 取 是 怎样 进行 的 ， 考 虑 一 个 场景 : 
Al A0 =10, CS 二 1，WE = 二 0 和 OE = 1, A1 A0 的 值 使 Erge o 
得 从 译 码 器 发 出 的 标号 为 “ 字 2” 的 线 为 1， 其 他 字 线 为 0。 图 11-43 “WER” MERRER 
“ 字 2” 线 使 能 连接 第 2 行 D 触发 器 的 Q 输出 的 AND 门禁 止 连接 其 他 所 有 行 触发 器 输出 的 
AND 门 。 因 此 来 自 第 二 行 的 数据 流 过 两 个 OR 门 到 达 “ 读 使 能 ” 方 框 ， 进 入 双向 总 线 。 

内 存 的 写 人 要 借助 于 标记 为 MMV 的 方 框 ， 图 11-41 中 MMV 代表 单 稳 多 谐振 荡 器 。 假 
定 D 触发 器 是 主 - 从 触发 器 的 变种 ， 存 储 需 要 一 个 Ck 脉冲 从 低 电 平 到 高 电 平 然后 再 从 高 变 
回 低 ， 如 图 11-11 所 示 。 单 稳 多 谐振 荡 器 (monostable multivibrator) 就 是 一 个 提供 这 样 脉冲 
的 设备 。 图 11-44 展示 的 是 有 初始 延迟 的 单 


稳 多 谐振 荡 器 的 时 序 图 。 当 输入 线 升 高 时 就 teh —_— 
会 触发 一 个 延迟 电路 ， 经 过 一 个 预 设 的 时 间 输出 | | 

间 隐 后 ， 延 迟 电 路 触发 单 稳 多 谐振 荡 右 ， 发 i ER Ph, 

出 具有 预 设 宽度 的 时 钟 脉冲 。 单 稳 多 谐振 荡 

器 激活 时 会 发 出 一 个 “ 单 次 ”(one shot) 脉冲 ， 图 11-44” 带 初始 延迟 的 单 稳 多 谐振 功 表 的 时 序 图 
因此 它 也 称 为 单 次 设备 。 

来 看 一 看 内 存 写 人 是 如 何 进行 的 ， 考 虑 这 样 一 个 场景 : Al A0 =10, CO=1, WE=1 
和 OE = 0。 假 设 地 址 线 、 数 据 线 和 控制 线 的 设置 是 同时 发 生 的 ， 内 存 电 路 必须 要 等 待 地 址 
信和 号 传送 过 译 码 器 ， 然 后 才能 根据 时 钟 脉冲 把 数据 送 入 触发 右 。 工 程 上 设计 MMV 中 的 初 
始 延 久 ， 就 是 为 了 留 出 足够 的 时 间 使 得 在 根据 时 钟 送 入 数据 之 前 译 码 需 的 输出 能 够 设置 好 。 
“ 读 使 能 ”电路 把 来 自 双向 总 线 的 数据 放 到 所 有 触发 器 的 输入 。 不 过 当 MMV 发 出 时 钟 脉冲 
时 ， 它 连接 的 四 个 AND 门 中 有 三 个 将 会 禁止 脉冲 到 达 它 们 所 在 的 行 ， 脉 冲 只 能 到 达 “ 字 2” 
那 一 行 ， 所 以 这 是 能 存储 数据 的 唯一 的 触发 器 。 

市 场 上 有 几 种 类 型 的 内 存心 片 ， 图 11-41 中 的 电路 模型 与 称 为 静态 内 存 〈static memory) 
或 SRAM 的 内 存 是 最 为 相似 的 。 实 际 上 ， 主 - 从 DD 触发 器 并 不 是 位 存储 需 的 基础 ， 因 为 它 
使 用 了 不 必要 的 晶体 管 。 许 多 静态 RAM 设备 使 用 的 电路 是 对 图 11-1b 的 修改 ， 即 一 个 由 一 
对 带 反 馈 的 反 相 器 组 成 的 稳定 电路 ， 它 只 需 两 个 额外 的 晶体 管 来 实现 设置 状态 的 机 制 。 静 态 
RAM 的 优势 是 速度 ,但 由 于 每 个 位 单元 都 需要 几 个 晶体 管 ， 因 此 劣势 是 心 片 尺寸 。 

为 了 克服 静态 内 存 尺 寸 的 劣势 ， 动态 内 存 ( dynamic memory) 或 DRAM 的 每 个 位 单元 
只 使 用 一 个 晶体 管 和 一 个 电容 ， 通 过 在 电容 上 存储 电荷 来 存储 数据 。 由 于 这 种 位 单元 的 尺寸 
小 ， 因 此 DRAM 芯片 的 存储 容量 要 比 SRAM 芯片 大 很 多 。DRAM 的 问题 在 于 电容 中 的 电 
荷 在 充满 几 毫 秒 之 后 会 慢 慢 泄漏 ， 在 过 多 的 电荷 泄漏 之 前 ， 内 存 子 系统 必 须要 从 单元 读 取 数 
据 ， 如 有 必要 还 要 给 电容 充 回 电荷 。 和 预期 的 一 样 ， 刷新 操作 要 花费 时 间 ， 所 以 DRAM 内 
存 要 比 SRAM 内 存 慢 。 

相 比 于 读 / 写 内 存 ， 只 读 内 存 (read-only memory) 或 ROM 用 于 存储 不 会 改变 的 数据 。 
在 工厂 生产 时 ， 忌 片 的 每 个 位 单元 的 数据 就 设置 好 了 ， 这 种 情况 下 用 户 向 厂商 提供 要 存储 的 
位 模式 。 除 此 之 外 ， 还 有 可 编程 ROM (programable ROM) 或 PROM 芯片 ， 人 允许 用 户 编 写 
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Wish, eA ae PF TFA a TES A RRR, EAT A. A 
TRR BY wi Fe RA, T5 PROM (erasable PROM) 或 EPROM 可 以 通过 把 电路 曝 
光 在 紫外 线 下 擦 除 整 个 芯片 。EPROM 芯片 封装 在 一 个 透明 窗口 下 ， 这 样 电 路 可 以 暴露 在 射 
kh, HR EPROM 芯片 就 必须 把 它 从 计算 机 中 拿 出 来 进行 曝光 ， 然 后 对 整个 芯片 重新 编 
程 。 电 子 可 擦 除 PROM (electrically erasable PROM) 或 EEPROM 人 允许 用 户 用 合适 的 电子 信 
号 组 合 来 擦 除 单个 单元 ， 这 样 就 不 用 把 设备 取出 来 ， 也 不 用 重新 编程 。 对 单元 进行 编程 的 电 
路 使 用 的 电压 不 同 于 在 必 片 正常 操作 期 间 读 取 数据 的 电压 ， 因 此 设计 起 来 会 更 加 复杂 。 

SRAM 和 DRAM 是 易 失 的 ， 也 就 是 说 关 掉 电路 的 电源 时 ， 数 据 就 会 丢失 。ROM 设备 是 
非 易 失 的 ， 因 为 它们 维持 数据 不 需要 外 部 电源 。 对 于 数码 相机 、 手 机 和 MP3 播放 器 这 样 的 
手持 消费 设备 来 说 ， 闪 存 (flash memory) 是 非常 受 欢 迎 的 。 它 是 一 种 EEPROM， 具有 设备 
掉 电 后 仍然 保持 数据 这 个 优势 。 对 于 闪存 ， 用 户 可 以 读 取 单个 单元 , 但 是 只 能 写 人 整个 单元 
块 。 在 写 单元 块 之 前 ， 必 须 将 其 完全 擦 除 。 闪 存 卡 由 一 组 闪存 芯片 组 成 ， 闪 存 驱 动 需 与 之 类 
似 ， 只 是 接口 电路 使 其 看 上 去 像 一 块 硬盘 。 但 它 实际 上 并 不 是 硬盘 ， 也 没有 移动 部 件 。 相 比 
于 同样 大 小 的 硬盘 ， 闪 存 驱 动 右 速度 更 快 ， 但 存储 的 数据 量 要 小 很 多 。 微 硬盘 和 闪存 技术 在 
市 场 上 相互 竞争 ， 厂 商 现 在 提供 封装 好 的 硬盘 ， 它 的 接口 使 它 表现 得 如 同 闪 存 ， 你 可 以 把 它 
插入 数码 相机 来 替代 内 存 卡 。 现 在 有 看 上 去 像 硬 盘 的 闪存 和 看 上 去 像 内 存 卡 的 硬盘 ， 这 是 抽 
象 在 现实 中 得 以 运用 的 例证 。 


Lynn Conway 和 Carver Mead 

早期 计算 机 由 晶体 管 、 电 阻 器 和 电容 器 组 成 ， 之 后 主要 的 进步 是 小 规模 集成 电路 
(SSIT)， 一 个 芯片 上 最 多 制造 10 个 门 。 后 来 出 现 了 中 规模 集成 电路 (MSI)， 一 个 芯片 上 最 
多 可 以 制造 100 个 门 ， 然 后 是 大 规模 集成 电路 (LSI) 和 超大 规模 集成 电路 (VLSI)， 一 个 
芯片 上 分 别 最 多 有 10 000 个 门 和 100 000 个 门 。 现 在 是 特大 规模 集成 电路 (ULSI) HK, 
一 个 芯片 上 最 多 有 10 000 000 个 门 。 

20 世纪 70 年 代 中 期 ， 半 导体 工业 达到 LSI。 大 的 制造 商 生 产 出 一 系列 LSI 芯片， 用 
户 购买 并 连接 这 些 芯 片 以 组 成 数字 系统 。 集 成 度 的 进一步 提高 则 超出 了 个 人 或 小 公司 的 能 
力 范围 ， 因 为 这 样 的 系统 看 上 去 太 过 复杂 。 

不 过 有 两 个 人 准备 为 半导体 工业 带 来 根本 性 的 巨大 变革 。Lynn Conway 1963 年 在 
哥伦比亚 大 学 获得 电子 工程 专业 硕士 学 位 ， 她 在 IBM 研究 院 工 作 过 一 段 时 间 ， 发 明了 
ACS-1 项 目 中 的 动态 指令 调度 ， 后 来 又 在 其 他 公司 工作 过 ，1973 年 进入 施乐 ( Xerox) 公 
司 ， 在 令 人 激动 的 新 Palo Alto 研究 中 心 工 作 。Carver Mead 自称 Caltech (加 州 理工 学 院 ) 
的 “无 期 徒刑 者 " ， 他 的 所 有 学 位 都 是 在 那里 取得 的 ， 直 至 1959 年 获得 电子 工程 专业 博士 
学 位 ， 并 且 留 校 执教 40 余年 。 

Conway 和 Mead 于 1975 年 开始 合作 。Conway 从 事 硅 结构 项 目 ， 需 要 及 时 设计 出 电 
子 电 路 ， 若 使 用 当时 的 LSI 芯片 ， 这 将 是 个 极端 耗 时 的 任务 。 

她 和 Mead 一 起 提出 了 一 个 强大 的 想法 一 一 只 要 抽象 层次 得 当 ，VLSI 电路 设计 可 以 
用 计算 机 自动 产生 。 他 们 归纳 出 硅 设 计 原 则 ， 这 样 VLSI 设计 者 不 用 再 面 对 单个 逻辑 门 ， 

只 需 处 理 较 高 抽象 层次 上 的 黑 盒 子 。 通 过 隐藏 低层 的 细节 ， 小 的 设计 团队 甚至 个 人 都 能 
够 设计 出 自己 定制 的 VLSI 电路， 而 不 必 限 制 在 当时 已 有 的 LSI 芯 片上 。 
工业 界 的 反应 是 非常 怀疑 。Mead 预言 定制 的 VLSI 电路 由 每 个 需要 芯片 的 组 织 自己 
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设计 ， 然 后 交付 给 “ 硅 铸 造 厂 ” 制 造 。 为 了 推广 这 个 理念 ，Mead 和 Conway 在 1979 年 
写 了 一 本 书 一 一 《 VLSI 系统 入 门 》(Introduction to VLSI Systems), Conway 1978 ~ 1979 
年 在 MIT 做 客座 教授 ， 在 一 门 课程 中 使 
用 了 这 本 书 的 样 书 ， 她 要 求学 生 在 一 个 学 
期 里 设计 和 构造 一 个 VLSI 芯片。 在 这 门 
著名 的 课程 获得 成 功 之 后 ， 这 本 书 在 超过 
100 所 学 校 中 使 有 用， 这些 学 校 的 学 生 最 终 
永远 地 改变 了 半导体 工业 一 一 硅 铸 造 厂 现 
在 是 每 年 超过 300 亿美 元 的 产业 。 

Lynn Conway 获得 了 许多 奖项 ， 包 括 
当选 IEEE Fellow (IEEEA+) 和 美国 国 
家 工程 院 院士 。Carver Mead 获得 的 奖项 包括 Harry Goode 纪念 奖 和 国家 科技 勋章 。 

“聆听 科技 的 声音 ， 听 清 它 在 诉说 什么 。” 



















Carver Mead 


11.3.4 地址 译 码 


单个 内 存 芯 片 通常 不 能 提供 整个 计算 机 所 需 的 主 存 ， 必 须 把 几 个 芯片 组 合成 内 存 子 系统 
才能 提供 足够 的 存储 能 力 。 大 多 数 计 算 机 是 按 字 节 寻 址 的 ，Pep/8 也 是 一 样 。 像 图 11-40a 那 
样 的 芯片 对 于 这 样 的 机 器 来 说 是 非常 方便 的 ， 因 为 芯片 字 的 大 小 和 CPU 寻 址 单元 的 大 小 是 
一 致 的 。 

不 过 ,假设 有 图 11-41 所 示 的 一 组 4 x2 世 片 ， 想 把 它 用 在 Pep/8 中 。 芯 片 的 字 大 小 为 
2, CPU 的 可 寻 址 单元 大 小 是 8， 所 以 必须 把 四 个 4X2 的 芯片 组 合 构成 一 个 4x8 的 内 存 模 
块 。 图 11-45 给 出 了 连接 方式 ， 可 以 看 到 这 个 模块 的 输入 和 输出 线 与 一 个 4x8 芯片 的 输入 
输出 线 是 完全 一 样 的 。 内 存 中 每 个 字 节 的 位 分 布 在 四 个 芯片 上 ， 地 址 Al AO = 01 WFAN 
每 个 位 存储 在 所 有 四 个 芯片 的 第 二 行 ( 字 1 )。 


A0 DO 
Al Dl 





D7 D6 D5 D4 D3 D2 D1 DO 
a) 方块 图 b) 实现 


KI 11-45 ”从 四 个 4X2 的 内 存 芯 片 构造 一 个 4X8 的 内 存 模 块 


类 似 地 ， 要 构建 一 个 512Xx8 的 内 存 模块 就 需要 8 个 图 11-40b 所 示 的 芯片 。 为 了 获得 高 
可 靠 性 ， 单 元 为 八 位 需要 使 用 11 个 芯片 ， 三 个 额外 的 芯片 用 于 单 错误 纠 错 ， 如 同 9.4 节 描 
述 的 那样 。 对 于 这 样 的 ECC 系统 ， 每 个 字 节 的 位 将 会 分 布 于 11 个 心 片 。 

这 些 例子 展示 了 怎样 把 几 个 nxm 忌 片 组 合成 一 个 nxk 忌 片 模块 ， 这 里 的 k 大 于 m， 通 
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常 来 说 ,必须 是 m 的 倍数 。 可 以 简单 地 把 km 个 芯片 所 有 公用 的 地 址 线 和 控制 线 连接 起 来 ， 
把 每 个 芯片 的 数据 线 分 配给 模块 的 数据 线 。 

构建 内 存 子 系 统 的 男 一 个 问题 是 ， 现 有 几 个 nxm hh, m 等 于 CPU 可 寻 址 单元 的 大 
小 ， 想 构建 一 个 1x m 的 模块 ， 这 里 的 1 大 于 n。 换 句 话 说 ， 如 果 有 一 套 忌 片 ， 它 的 字 大 小 等 
于 CPU 可 寻 址 单元 的 大 小 ， 怎 样 连接 它们 并 把 内 存 加 到 计算 机 中 呢 ? 关键 是 要 使 用 芯片 选 
择 线 CS， 使 得 来 自 CPU 的 所 有 地 址 请 求 只 能 选择 一 个 芯片 。 把 内 存世 片 连接 到 地 址 总 线 的 
技术 叫 作 地 址 译 码 ， 它 有 两 种 类 型 : 全 地 址 译 码 和 部 分 地 址 译 码 。 

图 11-46 展示 的 是 一 个 有 8 条 地 址 


线 、 能 存储 28 或 2356 字 节 的 CPU 内 存 
HT RAAT, AA 1 pi 


不 切实 际 。 有 四 个 芯片 需要 连接 进 CPU 


的 地 址 空间 : 安装 在 地 址 0 的 64 字 节 RAM am 
RAM, & 38 4 Hh ht 64 的 32 字 节 RAM, 8 端口 IO 芯片 
安装 在 地 址 208 AY 8 端口 IO 芯片 和 安装 图 11-46 一 个 具有 八 位 地 址 线 的 
在 地 址 224 的 32 字 节 ROM. 256 字 节 内 存 的 内 存 映 射 


8 端口 IO 芯片 实现 的 是 称 为 内 存 映 射 (memory-mapped) 的 IO， 这 在 很 多 计算 机 系 
统 中 都 很 常见 。 指 令 集 里 有 原生 LO 指令 的 计算 机 (例如 Pep/8 )， 不 需 使 用 内 存 映射 VO. 
Pep/8 的 原生 输入 和 输出 指令 是 CHARI AI CHARO, MAIT CHARI AY, CPU 从 CHARI 指令 
未 明确 指定 的 输入 设备 获取 输入 ， 并 把 这 个 字 节 存储 在 操作 数 指示 符 和 寻 址 模式 确定 的 内 
存 位 置 上 。 相 比 之 下 ,采用 内 存 映射 IO 系统 的 指令 集 不 需要 任何 IO 指令 ，CPU 的 LOAD 

令 完成 输入 ，STORE 指令 完成 输出 。 在 图 11-46 中 ，8 端口 IO 芯片 将 8 个 IO 设备 映射 

至 208 ~ 215 的 内 存 地 址 。 例 如 ， 键 盘 可 能 映射 到 208， 显 示 器 映射 到 209， 打 印 机 映射 到 
210， 等 等 。 在 没有 内 存 映射 VO 的 计算 机 上 ， 例 如 Pep/8 ， 从 键盘 输入 一 个 字 节 的 程序 是 

CHARI char,s 
但 是 在 如 图 11-46 中 所 配置 的 有 内 存 映射 IO 的 计算 机 上 ， 从 键盘 输入 一 个 字 节 是 

LDA 208,d 

STA char,s 
类 似 地 ， 可 以 用 如 下 存储 指令 将 一 个 字符 发 送 到 打印 机 

LDA char,s 

STA 210,d 
为 使 内 存 上 映射 IO 正常 工作 ， 系 统 需要 电路 能 检测 IO 设备 映射 到 的 内 存 地 址 的 装 入 和 存储 
是 否 已 经 完成 。 检 测 这 类 事件 会 激活 必要 的 电路 来 控制 IO 设备 。 

图 11-46 中 的 每 个 RAM 和 ROM 芯片 都 有 8 条 双向 数据 线 。 不 过 8 ig 1/0 芯片 有 64 
条 数据 线 ， 第 一 组 8 条 数据 线 把 键盘 连接 到 地 址 208， 第 二 组 8 条 数据 线 把 显示 器 连接 到 
209， 以 此 类 推 。 

可 以 根据 图 11-47 的 表 来 确定 怎样 将 芯片 连接 到 地 址 总 线 。 对 于 每 个 芯片 ， 以 二 进 制 写 
出 最 小 的 地 址 ， 即 芯片 起 始 字 节 的 地 址 ， 和 最 大 地 址 ， 即 芯片 最 后 一 个 字 节 的 地 址 。 比 较 这 
两 个 位 模式 ， 就 可 以 确定 每 个 忆 片 对 应 地 址 范围 的 通用 格式 。 例 如 ，8 端口 IO 芯片 的 通用 
地 址 是 1101 0xxx， 这 表示 对 应 的 地 址 范围 从 1101 0000 到 1101 0111， 每 个 字母 x 可 以 是 0 
也 可 以 是 1， 所 以 当 且 仅 当 前 $ 位 数字 是 11010 时 ， 选 中 的 一 定 是 这 个 8 端口 IO 芯片 。 
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图 11-47 对 图 11-46 中 内 存 映射 做 地 址 译 码 的 表格 


图 11-48 展示 的 是 用 全 地 址 译 码 方式 把 心 片 连接 到 地 址 总 线 。8 端口 LO 的 三 条 地 址 线 
连接 到 地 址 总 线 的 三 条 最 低位 线 上 ，5 条 最 高 地 址 线 通过 一 对 反 相 门 和 一 个 AND PIE AGE 
片 选 择 端 (图 中 对 反 相 器 做 了 简化 ， 显 示 成 AND 门 的 反 相 输入 )。 从 这 个 电路 可 以 看 出 ， 当 
且 仅 当 总 线 上 前 五 位 为 11010 时 ， 该 8 端口 IO 芯片 的 芯片 选择 线 将 会 是 1。 





图 11-48 ”对 图 11-46 中 内 存 映射 做 全 地 址 译 码 


为 了 保持 图 的 人 简洁， 在 图 中 没有 显示 心 片 的 数据 线 。RAM 和 ROM 心 片 的 数据 线 都 连 
接 一 个 8 位 双 回 数据 总 线 。 图 中 也 没有 显示 控制 输入 WE 和 OE， 它们 连接 内 存 模块 公用 的 
WE 和 OE. 

如 果 知 道 某 个 内 存 子 系统 绝 不 会 通过 增加 更 多 内 存 进行 升级 ,那么 就 可 以 使 用 部 分 地 址 
译 码 。 典 型 的 场景 是 一 个 小 型 的 不 支持 用 户 升 级 的 计算 机 控制 装置 ， 它 的 主要 思想 是 在 译 码 
电路 中 把 门 的 数量 减少 到 刚好 满足 系统 访问 设备 的 需要 。 

这 种 简化 技术 就 是 写 出 芯片 的 通用 地 址 ， 每 行 一 个 ， 然 后 检查 列 。 对 于 图 11-47 中 的 心 
片 ， 通 用 地 址 为 

00xx xxxx, 64x 8 位 RAM 

010x xxxx, 32x 8 位 RAM 

1101 Oxxx, 8 端口 IO 芯片 

111x xxxx, 32x 8 fii ROM 

来 看 看 第 一 个 芯片 ， 检 查 通用 地 址 的 列 ， 看 如 何 用 最 少量 的 信息 来 唯一 确定 第 一 个 心 
片 。 可 以 看 到 第 一 个 芯片 的 第 二 列 对 应 地 址 线 A6 为 0， 其 他 芯片 的 该 位 为 1， 因此 不 管 A7 
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的 值 是 什么 ， 只 要 A6, 为 0， 就 可 以 选择 第 一 个 芯片 。 

现在 来 看 第 二 个 芯片 ， 寿 用 全 地 址 译 码 就 必须 测试 三 条 地 址 线 : A7、A6 和 A5。 只 测 
试 两 条 可 以 吗 ? 例如 ， 能 测试 A7 AS = 00 吗 ? 不 能 ， 因 为 A7 A6 AS = 000 将 会 选择 第 一 
个 芯片 ， 那 么 会 同时 选择 两 个 芯片 。 能 测试 A6 AS = 10 吗 ? 不 能 ， 因 为 A7 A6 AS A4 A3 = 
11010 会 选择 8 端口 IO 芯片 ， 又 有 冲突 。 不 过 ， 通 过 观察 所 有 列 可 以 发 现 没有 其 他 芯片 的 
前 两 位 为 01， 因 此 可 以 通过 测试 A7 A6 = 01 来 选择 第 二 个 芯片 。 

通过 类 似 的 推理 可 以 看 到 ， 可 测试 A7 A6 AS = 110 来 选择 第 三 个 芯片 ， 测 试 A7 A6 AS = 
111 来 选择 第 四 个 发 片 。 图 11-49 展示 了 简化 的 最 终结 果 。 相 比 于 图 11-48 ， 我 们 去 掉 了 一 个 
两 输入 AND 门 和 三 个 反 相 器 ， 将 一 个 AND 门 的 输入 从 3 个 减少 到 2 个 ， 另 一 个 AND 门 的 
输入 从 5 个 减少 到 3 个 。 





图 11-49 ”对 图 11-46 中 内 存 映 射 做 部 分 地 址 译 码 


这 自然 会 产生 一 个 问题 : 图 11-48 和 图 11-49 的 内 存 模块 行为 有 什么 不 同 ?” 当 CPU 访问 
图 11-46 内 存 图 的 阴影 区 域 之 一 时 ， 没 有 任何 不 同 。 使 用 全 地 址 译 码 时 ， 如 果 CPU 访问 阴 
影 区 域 之 外 的 地 址 ， 则 没有 芯片 被 选中 ， 数 据 总 线 上 的 数据 是 不 可 预测 的 。 然 而 使 用 部 分 地 
址 译 码 ，CPU 可 能 会 访问 某 个 芯片 。 

来 看 64X8 位 的 RAM， 它 的 通用 地 址 为 00xx xxxx， 如 果 A6 为 0， 它 会 被 选中 ， 分 为 
两 种 情况 : 地 址 请 求 为 00xx xxxx 和 10xx xxxx。 第 一 个 地 址 范围 是 设计 好 的 ， 但 是 第 二 个 
地 址 范围 是 部 分 地 址 译 码 的 副作用 ， 实 际 上 是 把 一 个 物理 设备 映射 到 地 址 空间 的 两 个 区 域 ， 
CPU 在 地 址 0 和 128 看 到 的 是 一 个 芯片 的 殉 
隆 。 类 似 的 推理 显示 32X8 位 RAM 在 地 址 
96 又 复制 了 一 次 ，8 端口 IO 芯片 在 三 个 地 
方 进行 了 复制 。ROM 没有 复制 ， 因 为 对 于 全 
地 址 和 部 分 地 址 译 码 ， 它 的 地 址 译 码 电路 是 
一 样 的 。 图 11-50 展示 的 是 部 分 地 址 译 码 的 RAM | 8 端口 70 


内 存 图 。 图 11-50 图 11-49 中 部 分 地 址 译 码 的 内 存 映 射 
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使 用 部 分 地 址 译 码 时 必须 小 心 。 在 这 个 例子 中 ， 忌 片 以 无 缺口 、 无 重复 、 完 全 填充 内 存 
图 的 方式 进行 复制 。 如 果 你 的 译 码 在 得 到 的 映射 图 中 留 下 缺口 ， 这 不 会 带 来 什么 危害 。 如 果 
CPU 访问 的 是 空 晶 区域， 那么 没有 芯片 会 被 选中 。 然 而 如 果 你 的 译 码 产生 了 重复 ， 那 就 意 
味 着 如 果 CPU 要 访问 地 址 空间 的 这 个 区 域 ， 那 么 会 有 多 个 芯片 被 选中 ， 这 对 系统 是 有 害 的 。 
当然 ， 可 以 假设 CPU 绝对 不 会 访问 这 个 区 域 ， 就 像 它 可 以 访问 真正 的 芯片 就 不 会 访问 复制 
的 芯片 一 样 。 但 是 怎么 可 以 假设 程序 中 不 会 有 错误 呢 ? 


11.3.5” 双 端口 寄存 器 体 


在 前 一 节 介 绍 的 所 有 内 存 子 系统 中 ， 一 组 地 址 线 对 应 的 都 只 有 一 组 数据 线 ， 这 种 组 织 结 
构 对 于 计算 机 主 存 子 系统 来 说 是 合适 的 ， 因 为 主 存 和 CPU 通常 不 在 同一 集成 电路 上 。 图 4-2 
展示 的 是 Pep/8 CPU 中 的 寄存 器 ， 它 们 的 组 织 结构 很 像 内 存 子 系统 ， 但 是 位 于 CPU 中 的 寄 
存 器 体 里 面 。CPU 中 的 寄存 器 体 在 以 下 两 方面 不 同 于 内 存 芯 片 的 存储 结构 : 

o 数据 总 线 是 单 向 而 不 是 双向 的 

e 有 两 个 而 不 是 一 个 输出 端口 
图 11-51 展示 的 是 地 址 从 0 一 31 的 32 个 8 位 寄存 器 ， 前 5 个 寄存 器 对 ISA 层 的 程序 员 是 可 
见 的 。 每 个 16 位 寄存 器 分 成 两 个 8 位 寄存 器 ， 这 种 划分 对 机 器 层 的 程序 员 是 不 可 见 的 。 


把 一 一 LoadCk 
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CPU 寄存 器 


图 11-51 Pep/8 CPU 中 的 32 个 8 位 寄存 器 


其 余 寄存 器 (地 址 从 11 ~ 31) 对 机 器 层 程 序 员 是 不 可 见 的 。 寄 存 器 11 ~ 21 用 于 存储 
临时 变量 ; 22~31 是 包含 定 值 的 只 读 寄 存 器 ， 类 似 于 ROM， 如 果 想 存储 ， 寄 存 器 中 的 值 
不 会 改变 ， 这 些 常 数值 以 十 六 进 制 给 出 。 只 读 寄 存 器 实际 上 不 是 时 序 电 路 ， 因 此 没有 用 阴影 
表示 。 它 们 没有 可 以 改变 的 状态 ， 因 此 更 像 是 组 合 电路 。 

” 主 存 芯 片 有 一 组 地 址 线 和 一 组 双向 数据 线 ， 而 寄存 器 体 有 三 组 地 址 A、B 和 C， 以 及 
三 条 单 向 数据 总 线 ABus、BBus 和 CBus，ABus 和 BBus 是 两 个 输出 端口 ，CBus 是 输入 端 
口 。 每 条 数据 总 线 都 是 8 位 宽 ， 每 组 地 址 线 都 包含 5 条 线路 ， 能 够 访问 2 个 寄存 器 中 的 任 
何 一 个 。 要 把 一 个 值 存储 到 寄存 器 中 ， 就 要 把 寄存 器 的 地 址 放 到 C 上 ， 把 待 存储 的 数据 放 
到 CBus 上 ， 给 标记 为 LoadCk 的 控制 线 时 钟 信 号 。 通 过 两 个 输出 端口 可 以 同时 读 取 两 个 不 
同 的 寄存 器 ， 可 以 把 一 个 地 址 放 在 A 上 ， 一 个 放 在 B 上 , 来 自 这 两 个 寄存 器 的 数据 将 同时 
出 现在 ABus 和 BBus 上 。 也 允许 把 同一 地 址 放 在 A 和 B 上 ， 这 样 来 自 同一 个 寄存 器 的 数据 
将 出 现在 ABus 和 BBus 上 。 
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图 11-52 展示 的 是 双 端 口 寄存 器 体 的 实现 。 输 入 遵循 和 主 存 芯 片 一 样 的 基础 组 织 结构 ， 
C 的 5 条 地 址 线 使 译 码 器 的 一 条 输出 线 为 1， 其 余 为 0。CBus 连接 全 部 32 个 寄存 器 ， 当 
LoadCk 控制 线 有 脉冲 时 ，CBus 上 的 值 就 随时 钟 信号 存 人 茶 一 个 寄存 器 中 。 


LoadCk 


C 
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图 11-52 图 11-51 中 双 端 口 寄 存 器 体 的 实现 


两 输出 端口 由 两 个 32 路 输入 复 用 器 组 成 ， 每 路 可 以 发 送 8 位 的 量 。 每 个 复 用 器 是 一 组 
8 个 32 输入 复 用 器 ， 类 似 于 图 10-43 中 的 复 用 器 。A 的 5 条 线 连接 到 第 一 个 端口 中 所 有 8 个 
复 用 器 的 5 条 选择 线 。 第 一 个 复 用 器 负责 选择 和 传送 所 有 32 个 寄存 器 的 第 一 位 ， 第 二 个 复 
用 器 负责 选择 和 传送 所 有 32 个 寄存 器 的 第 二 位 ， 以 此 类 推 。 





总 结 


由 带 反 馈 回 路 的 逻辑 门 构建 的 时 序 电 路 可 以 记忆 状态 。 四 个 基本 时 序 设备 是 SR 触发 器 
(设置 ， 重 置 )、 下 触发 器 、D 触发 器 (数据 或 延迟 ) 和 T 触 发 器 〈 反 转 )。SR 触发 器 的 S 输 
入 把 状态 设置 为 1，R 输入 把 状态 重 置 为 0，SR = 11 这 种 输入 情况 是 未 定义 的 。 除 了 定义 
了 JK = 11 这 种 情况 并 反 转 状态 外 ，JK 的 输入 与 SR 一 样 。D 输入 直接 传送 到 状态 。 如 果 工 
输入 为 1， 那么 状态 反 转 ， 否 则 保持 不 变 。 每 种 触发 器 都 可 以 构造 成 主 - 从 设备 ， 以 解决 外 
部 反馈 引起 的 不 稳定 问题 。 

时 序 电路 通常 由 一 个 组 合 电路 组 成 ， 该 组 合 电 路 的 输出 反馈 到 一 组 状态 寄存 器 中 ， 状 态 
寄存 器 的 输出 又 反馈 到 组 合 电路 的 输入 。 可 以 用 状态 转移 图 来 描述 时 序 电 路 的 特性 ， 状 态 转 
移 图 是 有 限 状态 机 的 一 种 表现 形式 。 在 分 析 时 序 电 路 时 ， 输 入 和 时 序 电 路 是 给 定 的 ， 要 确定 
的 是 输出 。 

设计 时 序 电 路 则 是 给 出 输入 和 期 望 的 输出 ， 要 确定 时 序 电路 。 激 励 表 可 以 帮助 进行 设 
计 。 触 发 器 的 激励 表 由 设备 四 种 可 能 的 状态 改变 (0 到 0、0 到 1、1 到 0、1 到 1) 以 及 产生 
改变 所 需 的 输入 条 件 组 成 。 设 计 过 程 包括 对 产生 给 定 状 态 转 移 图 所 必需 的 输入 条 件 制 表 ， 然 
后 设计 组 合 电路 来 生成 这 些 输入 条 件 。 
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寄存 器 是 一 组 D 触发 器 。 三 态 缓冲 器 可 以 用 来 实现 双向 总 线 。( 从 概念 上 说 ) 内 存 忌 片 
是 一 个 DD 触发 器 的 数组 ， 有 一 组 地 址 线 、 数 据 线 和 控制 线 。 控 制 线 一 般 由 芯片 选择 (CS), 
写 使 能 (WE) 和 输入 使 能 (OE) 组 成 。 内 存 映射 IO 在 指令 集中 不 需要 有 原生 输入 /输出 
指令 ， 而 是 依靠 LOAD 指令 输入 、 依 靠 STORE 指令 输出 。 地 址 译 码 是 一 种 使 用 CS 线 、 由 一 
组 内 存 芯 片 构建 内 存 模块 的 技术 ， 部 分 地 址 译 码 会 把 选择 电路 中 门 的 数量 减 到 最 少 。Pep/8 
CPU 中 的 双 端 口 寄存 器 体 实 现 了 一 些 对 ISA 程序 员 可 见 的 寄存 器 ， 也 实现 了 对 ISA 程序 员 
可 见 的 临时 寄存 器 和 常量 寄存 器 。 


练习 


11.1 节 

*1. 在 什么 情况 下 ， 一 串 任意 数量 的 、 带 反馈 回路 的 反 相 器 (如 图 11-1 所 示 ) 会 形成 一 个 稳定 的 网 络 ? 
2. 构建 类 似 于 图 11-3 和 图 11-4 AOR, 说 明 如 果 SR 锁 存 器 的 起 始 状态 为 Q = 二 1， 则 R 变 为 1 又 变 回 
0 会 把 它 重 置 为 Q = 0。 

.在 图 11-10 中 定义 下 列 点 : (1) AEM ERASE AND 门 的 输出 。( 2 ) BEE FR ERA RE AND 门 
的 输出 。( 3 ) C 是 反 相 器 的 输出 。(4) D 是 上 面 从 锁 存 器 AND 门 的 输出 。(5 ) E 是 下 面 从 锁 存 器 
AND 门 的 输出 。 
假定 时 钟 脉冲 到 达 前 SR = 10, Q = 0。 做 表 展 示 出 图 11-11 中 下 述 每 个 间隔 期 间 A, B,C, D,E, 
R2、S2、Q 和 Q 的 值 ， 假 设 门 延 迟 为 0。 

* (a) tf 之 前 * (b) ti 和 之 间 (c) t Al ts ZI) 
(d) ts All t4 Z [A] (e) ts ZJA 

.时钟 脉冲 达到 前 SR = 01 A Q = 1 的 情况 下 再 做 一 遍 练习 3。 

. 画 出 下 面 触 发 需 的 类 似 图 11-14 的 状态 转移 图 : 

(a) JK * (b) D (c)T 

画 出 T 触 发 器 的 类 似 图 11-200 的 时 序 图 。 

.用 SR 触发 器 构建 T 触 发 器 。 

.本 节 展 示 了 怎样 用 SR 触发 器 和 一 些 门 构建 IK 触发 器 和 DD 触发 器 。 实 际 上 任何 触发 器 都 可 以 用 其 
他 触发 器 和 一 些 门 来 构成 。 用 JK 触发 器 构建 下 面 的 触发 器 : 


Ww 


nn A 


oo NO 


* (a) D (b) SR Lo) T 

用 DD ALERTS FBT AY fh A AE : 

(d) SR (e) JK (OHT 

用 工 触 发 需 构建 下 面 的 触发 器 : 

(g) SR (h) JK (i) D 
11.2% 


oO 


.* (a) 图 11-10 是 SR 主 - 从 触发 器 的 实现 ， 把 它 修改 为 可 提供 如 图 11-31 所 示 的 异步 清除 输入 。 
Clear 为 0 时 ， 设 备 应 该 正常 运行 ; Clear 为 1 时 ， 主 触发 器 的 状态 Q2 和 从 触发 器 的 状态 Q 都 被 强 
制 为 0， 无 论 时 钟 是 0 还 是 1。(b) 把 图 11-10 修改 成 可 提供 异步 预 设 置 。( c) 把 图 11-10 修改 成 既 
可 提供 异步 清除 ， 又 可 提供 异步 预 设置 。 

10. 一 个 时 序 电 路 有 两 个 下 触发 器 FFA 和 FFB ， 两 个 输入 X1 和 X2， 短发 器 笨 人 为 

iA = XL je = XIA 
KA = X2+X1AB KB = X2+X1A 
除了 触发 需 状 态 外 没有 其 他 输出 。 画 出 它 的 时 序 电路 的 逻辑 图 和 状态 转移 图 。 
11. 一 个 时 序 电 路 有 一 个 下 触发 器 FFA， 一 个 T 触 发 器 FFB ， 一 个 输入 X， 触 发 器 输入 为 
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J=X@B T=X@A 
K=XB 
输出 为 Z = 二 A B。 画 出 它 的 时 序 电 路 的 逻辑 图 和 状态 转移 图 。 
12. 一 个 时 序 电路 有 两 个 SR 触发 器 FFA 和 FFB ， 两 个 输入 X1 和 X2， 触 发 器 输入 为 
SA = XI Sn = X1X2A 
RA =X1 X2 RB = X1 A+ X2 
输出 为 Z = X1A。 画 出 它 的 时 序 电 路 的 逻辑 图 和 状态 转移 图 。 
13. 用 下 列 触发 器 设计 图 11-32 的 时 序 电路 
* (a) D (b) T 
14. 图 11-53 是 一 个 有 三 个 触发 器 和 一 个 输入 的 时 序 电 路 的 状态 转移 图 。 输 入 为 1 时 以 二 进 制 加 1， 输 
入 为 0 时 保持 状态 不 变 。 用 下 面 的 触发 器 设计 电路 并 画 出 逻辑 图 : 
(a) JK (b) SR (c) D (d) T 


l 


AS ANo Bko BA ANo AS 
0 0 0 0 0 0 0 
图 11-53 AY 14 的 状态 转移 图 


15. 图 11-54 是 一 个 有 三 个 触发 器 和 一 个 输入 的 时 序 电 路 的 状态 转移 图 。 输 入 为 1 时 以 二 进 制 加 1， 输 
人 为 0 以 二 进 制 减 1。 用 下 面 的 触发 吉 设 计 电 路 并 画 出 逻辑 图 : 
* (a) JK (b) SR (c) D (d) T 








图 11-54 AY 15 的 状态 转移 图 


16. 图 11-55 是 一 个 有 两 个 触发 器 和 两 个 输入 的 时 序 电路 的 状态 转移 图 。 输 入 为 01 时 以 二 进 制 加 1, 
输入 为 10 以 二 进 制 减 1， 输 入 为 00 时 状态 不 变 ， 
输入 11 绝对 不 会 发 生 ， 可 以 看 作 无 关 和 条件。 用 下 


面 的 触发 器 设计 电路 并 画 出 逻辑 图 : 
(a) JK (b) SR (c) D 
(d) T 


17. 一 个 时 序 电 路 有 6 个 状态 寄存 器 和 三 条 输入 线 。 
(a) 它 有 多 少 种 状态 ? (b) 每 个 状态 有 多 少 种 转 
移 ?(c) 总 共有 多 少 种 转移 ? 

11.3 5 


18. (a) 图 11-41 的 内 存世 片 里 有 多 少 个 AND 门 ， 多 图 11-55 AY 16 的 状态 转移 图 
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GA ORT], BYP RAB? 包括 译 码 器 中 的 门 ， 但 是 不 包括 D 触发 器 中 的 门 。(b) 图 11-40a 的 
内 存 芯 片 中 每 种 门 有 多 少 个 ? (c) 图 11-40b 的 内 存 芯 片 中 呢 ? 

19. 在 实际 中 ， 内 存 芯片 的 芯片 选择 线 为 低 电 平 ， 这 条 线 标记 为 CS 而 不 是 CS。 如 果 所 有 芯片 上 的 芯 
片 选 择 线 都 为 低 电 平 有 效 ， 图 11-48 会 怎样 改变 ? 

20. 一 个 计算 机 系统 的 数据 总 线 是 16 位 宽 。(a) 如 果 有 一 盒 IKX1 动态 RAM 芯片 ， 这 台 计 算 机 最 
少 有 多 少 内 存 字 节 ? (b) WRH 1Kbit 心 片 配置 成 256 x 4 的 设备 ， 那 么 (a) 中 问题 的 回答 又 是 
怎样 ? 

21. 有 一 个 10 位 地 址 总 线 的 小 型 CPU。 需 要 连接 一 个 64 字 节 PROM, — 32 字 节 的 RAM 和 一 个 有 
两 条 地 址 线 的 4 端口 IO 芯片 。 所 有 芯片 的 芯片 选择 为 高 电 平 有 效 。(a) 给 出 使 用 全 地 址 译 码 时 的 
连接 ，PROM 在 地 址 0, RAM 在 地 址 384，PIO 在 地 址 960。( 这 些 地 址 都 是 十 进 制 表示 的 。)(b) ith 
片 还 是 位 于 同样 的 位 置 ， 给 出 使 用 部 分 地 址 译 码 时 的 连接 。 给 出 使 用 部 分 地 址 译 码 时 的 内 存 图 ， 确 
ILA KR EB 

22. 说 明 图 11-52 上 部 的 每 个 复 用 器 是 怎样 连接 的 。 可 以 使 用 省 略 号 (...)。 

23. 图 11-52 的 双 端 口 寄存 器 体 有 和 多少 个 AND 门 ， 多 少 个 OR 门 ， 多 少 个 反 相 器 ? 包括 构建 译 码 器 和 
复 用 器 所 需要 的 门 ， 但 不 包括 组 成 寄存 器 的 D 触发 器 中 的 门 。 
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本 书 最 后 一 章 介 绍 LG1 层 组 合 电路 和 时 序 电 路 与 ISA3 层 机 器 之 间 的 关联 ， 讲 述 如 何 连 
接 硬 件 设备 以 形成 较 高 抽象 层次 上 的 咪 盒 子 ， 最 终 构 造 出 Pep/8 计算 机 。 
12.1 构造 ISA3 BALES 

图 12-1 是 Pep/8 计算 机 的 框图 ， 可 以 


看 出 CPU 分 成 数据 区 和 控制 区 。 数 据 区 从 el oon 
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制 区 向 数据 区 和 计算 机 的 其 他 部 分 发 送 控 ue 
制 信号 。 一 > 数据 流 
-> 控制 
12.1.1 中 央 处 理 单元 图 12-1 Pep/8 计算 机 的 框图 


图 12-2 是 Pep/8 CPU 的 数据 区 。 图 中 的 时 序 设备 标 上 了 阴影 ， 以 区 别 于 组 合 设 备 。 图 
顶部 的 CPU 寄存 器 与 图 11-51 的 双 端 口 寄存 器 体 一 致 。 

图 12-2 中 没有 给 出 的 控制 区 在 数据 区 的 右边 ， 从 右边 来 的 控制 线 就 发 自控 制 区 。 有 两 
类 控制 信号 : 组 合 电 路 控制 和 时 钟 脉冲 。 所 有 时 钟 脉冲 的 名 字 都 以 Ck 结尾 ， 用 来 使 数据 随 
着 时 钟 进 入 寄存 器 或 触发 器 。 例 如 ，MDRCk 是 MDR 的 时 钟 输入 。 当 有 脉冲 到 达 时 ， 来自 
MDRMux 的 输入 随时 钟 进入 MDR., 

图 12-2 左边 的 总 线 就 是 图 12-1 中 的 主 系统 总 线 ， 主 存 和 LO 设备 都 连接 到 总 线 上 。 
它 包 括 8 条 双向 数据 线 、16 条 地 址 线 和 2 条 控制 线 ，2 条 控制 线 在 图 的 底部 分 别 标识 为 
MemWrite 和 MemRead。 此 外 输入 和 输出 设备 的 控制 线 在 图 中 没有 给 出 。MAR 是 内 存 地 址 
寄存 器 ， 它 分 为 两 部 分 : 高 位 字 节 MARA 和 低位 字 节 MARB. 标号 为 “内 存 ” 的 方 框 是 一 
个 64KB 的 内 存 系统 。 总 线 的 16 位 地 址 线 是 单 向 的 ， 所 以 MAR 的 输出 通过 总 线 连接 到 内 
存 子 系统 的 地 址 端口 输入 上 。 数 据 总 线 是 双向 的 ， 在 MDR 和 总 线 之 间 有 一 组 八 个 三 态 缓冲 
器 〈 图 中 未 画 出 )， 由 MemWrite 控制 线 使 能 。 通 过 主 系 统 总 线 ，MemWrite 线 和 MemRead 
线 分 别 与 内 存 子 系统 的 WE RA OF 线 相 连 。 图 12-2 中 所 有 其 他 用 宽 箭 头 表示 的 总 线 都 是 
八 位 数据 总 线 ， 包括 ABus、BBus、CBus 和 把 主 系统 总 线 的 数据 线 连接 到 标号 为 MDRMux 
的 方 框 的 总 线 。 

每 个 复 用 器 ( AMux 、CMux 和 MDRMux) 都 是 一 组 八 个 二 输入 复 用 器 ， 它 们 的 控制 线 
连接 到 一 起 形成 图 12-2 中 的 一 条 控制 线 。 例 如 ， 图 中 标号 为 AMux 的 控制 线 同 时 连接 到 标 
号 为 AMux 的 方 框 中 八 个 复 用 器 体 的 八条 控制 线 。 复 用 器 控制 线 会 按照 如 下 方式 让 信和 号 通 
RHA: 

e 复 用 器 控制 线 为 0， 则 左边 的 输入 通过 到 输出 。 

e 复 用 需 控 制 线 为 1， 则 右边 的 输入 通过 到 输出 。 

例如 ， 如 果 MDRMux 控制 线 为 0， 则 MDRMux 会 把 总 线 的 内 容 送 到 MDR ; 如 果 控 制 
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线 为 1， 就 把 CBus 的 数据 送 到 MDR。 类 似 地 ， 如 果 AMux 控制 线 为 0，AMux 会 把 MDR 
的 内 容 送 到 ALU 的 左边 输入 ; 否则 就 把 来 自 ABus 的 数据 送 到 ALU 的 左边 输入 。 





MemWrite 
MemRead 





图 12-2 Pep/8 CPU 的 数据 区 


标号 为 ALU 的 方 框 是 图 10-54 的 算术 逻辑 单元 ， 通 过 图 12-2 中 标号 为 ALU 的 四 条 控 
制 线 ， 提 供 图 10-55 列 出 的 16 种 功能 。 状 态 位 (N、Z、V 和 C) 每 个 都 是 一 个 DD 触发 器 。 
例如 ， 标 号 为 C 的 方 框 是 一 个 D 触发 器 ， 存 储 进 位 位 的 值 。 该 触发 器 的 D 输入 来 自 ALU 
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的 Cout 信号 ; fh Aca AY Q 输出 既 在 顶部 也 在 底部 ， 顶 部 的 线 连接 进入 ALU 的 Cin 输入 ; 
触发 希 的 时 钟 输入 是 标号 为 CCk 的 控制 信号 。 每 个 状态 位 的 输出 都 反馈 到 进入 CMux 左边 
总 线 的 低 四 位 字 节 ， 高 四 位 硬件 设置 为 0。 每 个 状态 位 的 输出 同时 送 到 控制 区 。 

在 ISA 层 ， 每 个 寄存 器 都 是 16 位 ， 但 是 CPU 的 内 部 数据 
通路 只 有 8 位 宽 。 要 执行 16 位 数字 的 运算 ， 在 LG1 层 就 需要 ame | en 
两 个 8 位 数字 的 运算 。 如 果 结 果 的 16 位 都 为 0， 那 么 Z 位 就 必 
须 设 置 为 1， 也 就 是 两 个 8 位 运算 的 ALU 的 Zout 信号 都 为 1 
的 时 候 。 标 号 为 ANDZ 的 组 合 电路 框 帮助 计算 Z 位 ， 其 输出 是 
Z 位 的 D 触发 器 的 输入 ， 它 有 三 个 输入 : 来 自控 制 区 的 ANDZ 
fi A, A ALU 的 Zout 输 出 和 来 自 Z 位 的 D 触 发 器 的 Q 输 
Ho K 12-3 给 出 的 是 这 个 组 合 电 路 框 的 真 值 表 ， 它 有 两 种 运行 
模式 : EAEE 

e 如 果 ANDZ 控制 线 为 0， 则 Zout 直接 通过 到 输出 。 tie: Wetted 

e ea 控制 线 为 1， 则 Zout 和 Z 进行 与 ， 结 果 送 组 全 电路 的 真 值 表 
因此 Z 位 要 么 加 载 自 ALU 的 Zout 信 号 ， 要么 加 载 自 Zout 信号 和 Z 位 当前 值 的 与 ， 选 择 哪 
个 取决 于 来 自控 制 区 的 ANDZ 信和 叶 。 该 电路 的 实现 作为 章 末 的 一 道 练 习题 。 

数据 流 是 一 个 大 循环 ， 从 顶部 的 32 个 8 位 寄存 器 开始 ， 经 过 ABus 和 BBus， 再 经 过 
AMux 到 ALU， 最 终 经 过 CMux 通过 CBus 回 到 32 个 寄存 器 。 来 自主 存 的 数据 也 可 以 通过 
总 线 加 入 这 个 循环 ， 通 过 MDRMux 到 MDR。 从 MDR 数据 可 以 经 过 AMux、ALU 和 CMux 
到 达 任 一 个 CPU 寄存 器 。 要 把 CPU 寄存 器 的 内 容 送 到 内 存 ， 可 以 通过 ABus 和 AMux， 穿 
过 ALU, CMux 和 MDRMux 进入 MDR, M MDR 可 以 经 过 总 线 到 达 内 存 子 系统 。 

控制 区 有 32 条 控制 输出 线 和 12 条 输入 线 。32 条 输出 线 控制 数据 在 数据 区 里 的 流动 ， 
并 指明 要 发 生 的 处 理 。12 条 输入 线 是 来 自 BBus 的 8 条 线 ， 以 及 来 自 状 态 位 的 4 条 线 ， 控 制 
区 可 以 测试 某 些 条 件 。12.2 节 会 介绍 控制 区 如 何 产生 适当 的 控制 信号 。 为 了 介绍 数据 区 是 如 
何 工作 的 ， 现 在 假设 可 以 在 任何 时 刻 把 控制 线 设置 为 任何 想 要 的 值 。 


12.1.2 冯 … 诺 依 曼 周 期 


Pep/8 计算 机 的 核心 是 冯 ，… 诺 依 曼 周 期 。 图 12-2 中 的 数据 区 实现 了 汉 : 诺 依 曼 周 期 ， 它 
其 实 不 过 是 一 种 管道 系统 。 房 子 里 的 水 通过 各 种 龙头 和 阀门 控制 的 管道 ， 同 样 ， 信 号 (实际 
上 是 电子 ) 流 过 各 种 复 用 器 控制 的 总 线 线 路 。 在 通路 上 ,信号 可 以 通过 ALU, Æ ALU 按照 
需求 对 数据 进行 处 理 。 本 节 介 绍 实现 汉 ，: 诺 依 曼 周 期 所 需 的 控制 信号 ， 包 括 Pep/8 指令 集中 
某 些 典 型 指令 的 实现 ， 其 他 指令 的 实现 作为 章 末 练习 。 

图 4-31 是 在 ISA3 层 执行 程序 所 需 步 又 的 伪 代 码 描 述 。do 循环 是 汉 ，… 诺 依 曼 周 期 。 在 
LGI 层 ， 虽 然 指令 寄存 器 的 操作 数 指示 符 部 分 是 16 位 数字 ,但 实际 上 CPU 的 数据 区 是 对 8 
位 数字 进行 运算 。CPU 分 两 步 取 操 作 数 指示 符 ， 先 取 高 位 字 节 再 取 低 位 字 节 ， 取 完 每 个 字 
节 之 后 ， 控 制 区 会 把 PC 加 1。 图 12-4 EB - BREA LG] 层 的 伪 代 码 描述 。 

控制 区 把 控制 信号 发 到 数据 区 以 实现 冯 ' 诺 依 曼 周期 。 图 12-5 是 获取 指令 指示 符 和 PC 
加 1 的 控制 序列 。 图 中 没有 给 出 控制 区 确定 指令 是 否 是 一 元 指令 的 方法 。 章 末 有 一 道 练习 要 
求 写 出 指令 不 是 一 元 指令 时 ， 获 取 指 令 指 示 符 的 控制 信和 号。 
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do { 
FL PC 中 地 址 处 的 指令 指示 符 
PC PC + 1 
译 码 指令 指示 符 
if (指令 不 是 一 元 的 ) { 
取 PC 指定 的 操作 数 指 示 符 的 高 位 字 节 
PC 和 PC +1 


取 PC 指定 的 操作 数 指 示 符 的 低位 字 节 
PC PC+1 
} 
执行 取出 的 指令 
} 
(未 执行 停止 指令 ) && ( 指令 是 合法 的 ) 





图 12-4 75 - 详 依 曼 执行 周期 的 LG1 层 伪 代码 描述 


Save the status bits in Tl 
. CMux=0, C=11; LoadCk 


MAR <- PC, fetch instruction specifier. 
. A=6, B=7; MARCK 
. MemRead 
. MemRead, MDRMux=0; MDRCk 
. AMux=0, ALU=0, CMux=1, C=8; LoadCk 


PC <- PC + 1, low-order byte first. 
6. A=7, B=23, AMux=1, ALU=1, CMux=1, C=7; CCk, LoadCk 
. A=6, B=22, AMux=1, ALU=2, CMux=1, C=6; LoadCk 


If the instruction is not unary, fetch operand specifier 
and increment PC 


Restore the carry bit from Tl 
. A=11, AMux=1, ALU=15; CCk 





Execute the instruction fetched 
图 12-5 ”获取 指令 指示 符 和 了 PC 加 1 的 控制 信号 


图 12-5 中 的 每 一 行 都 是 一 个 CPU 时 钟 周期 ， 由 一 组 控制 信号 组 成 ， 这 些 控制 信号 会 注 
入 组 合 设备 ， 通 常 跟 有 一 个 时 钟 脉冲 进入 一 个 或 多 个 寄存 器 。 组 合 信 号 用 等 号 表示 ， 其 持续 
时 间 必 须 足 够 长 ， 使 得 数据 能 够 到 达 寄 存 器 ， 并 在 时 钟 的 控制 下 存 信 寄存器。 组 合 信号 的 设 
置 是 并 发 的 ， 所 以 用 逗号 分 隔 开 ， 逗 号 就 是 并 发 分 隔 符 。 组 合 信号 和 时 钟 信号 用 分 号 隔 开 ， 
分 号 是 时 序 分 隔 符 ， 因 为 时 钟 脉冲 是 在 设置 了 组 合 信号 之 后 才 施 加 的 。 注 释 用 双 斜 杠 (//) 
表示 。 

图 12-6 给 出 的 时 钟 周期 对 应 于 图 12-5 中 编号 1 一 4 的 行 。 以 s 为 单位 的 时 钟 周期 是 由 
以 Hz 为 单位 的 系统 时 钟 频率 RER, T= 1/f。 在 所 有 其 他 条 件 不 变 的 情况 下 ， 计 算 机 的 
频率 越 高 (以 MHz 为 单位 进行 衡量 )， 一 个 时 钟 周期 的 时 间 就 越 短 ， 计 算 机 执行 得 就 越 快 。 
所 以 是 什么 限制 了 CPU 的 速度 呢 ? 周期 必须 足够 长 ， 以 允许 信号 通过 组 合 电路 并 出 现在 寄 
存 器 的 输入 (寄存 器 是 时 序 电路 )， 然 后 下 一 个 时 钟 脉冲 才能 到 达 。 例 如 ,在 图 12-6 中 周期 
1 开始 的 时 候 ，CMux 线 变 为 0， 然 后 数据 从 左边 的 输入 总 线 通 过 CMux， 这 需要 一 定 的 时 
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间 。 同 时 ， 在 这 个 周期 开始 时 ，C 被 设置 为 11， 这 个 控制 信号 通过 图 11-51 所 示 的 译 码 器 也 
需要 一 定 的 时 间 。 周 期 了 必须 足够 长 ， 能 够 让 这 些 信 号 在 LoadCk 脉冲 到 达 前 把 数据 送 到 寄 
存 器 11 的 输入 。 


— 1 ———> 


— >a Oe ee E 


LoadCk | : 
MARCk 7 | ! : 





1m —CMux=0———>|+*+——_- 人 =0 一 > MemRead ——><—§ MemRead 


C=11 B=7 MDRMux=0 
LoadCk MARCk MDRCk 


图 12-6 图 12-5 的 前 四 个 周期 的 时 序 图 


程序 计数 器 是 一 个 16 位 的 数字 ， 在 冯 + 诺 依 曼 周 期 中 ，CPU 会 把 程序 计数 器 加 1。 它 
把 PC 的 低位 字 节 加 1， 并 存储 C 位 ， 用 来 加 到 高 位 字 节 上 。 这 样 一 来 ， 就 可 以 抹 掉 上 一 
条 指令 设置 的 C 位 了 。 图 12-5 中 的 周期 1 会 把 状态 位 存放 在 临时 寄存 器 Tl 中。 从 图 12-2 
可 以 看 到 状态 位 反馈 到 CMux 的 左边 输入 中 。 控 制 信号 C 对 Tl SHE ( 即 图 12-2 中 的 地 址 
11 )，LoadCk 信和 号 使 得 状态 位 随 着 时 钟 存 进 T1。 

周期 2 ~ 5 获取 指令 指示 符 。 在 周期 2，A = 6 把 寄存 器 6 送 到 ABus, B= 7 把 寄存 
器 7 送 到 BBus， 从 图 12-2 看 到 寄存 器 6 和 7 是 程序 计数 器 的 两 个 半边 。 周 期 2 中 的 MARCk 
脉冲 使 得 PC 随 着 时 钟 进 入 内 存 地 址 寄存 器 ( MAR)。 在 周期 3，MemRead 信号 启动 一 次 内 
存 读 。 访 存 地 址 在 周期 2 的 末尾 被 放 到 主 系统 总 线 上 ， 所 以 现在 MemRead 信号 激活 了 内 
存 子 系统 中 被 地 址 译 码 电路 选中 芯片 上 的 OE 线 。 内 存 子 系 统 的 延迟 很 大 ， 通 常 要 经 过 很 
多 CPU 周期 ， 数 据 才 能 出 现在 主 系统 总 线 上 。Pep/8 计算 机 要 求 在 地 址 随时 钟 进 入 MAR 
后 ，MemRead 在 两 个 连续 的 周期 内 有 有效， 以 此 来 模拟 访 存 延迟 较 长 的 情况 。 在 周期 4， 
MDRMux = 0 将 MDR 复 用 器 的 控制 线 设 置 为 0， 来 自 总 线 的 数据 会 穿 过 MDR 复 用 器 到 达 
内 存 数据 寄存 器 (MDR) 的 输入 。 周 期 4 中 的 MDRCk 脉冲 会 把 指令 指示 符 送 入 MDR。 

周期 5 把 指令 指示 符 从 MDR 送 入 指令 寄存 器 IR， 过 程 如 下 所 述 。 首 先 ，AMux 二 0 将 
AMux 控制 线 设 置 为 0， 这 就 把 MDR 送 到 了 AMux 复 用 器 的 输出 。 接 下 来 ，ALU = 0% 
ALU 控制 线 设置 为 0， 这 就 使 数据 不 改变 地 穿 过 ALU， 如 图 10-55 Bras. CMux = 1 把 数据 

601| 从 ALU 送 到 CBus， 然 后 C 一 8 把 C 设 置 为 8， 这 是 用 来 指定 指令 寄存 器 的 ， 如 图 12-2 所 
603| 示 。 最 后 ，LoadCk 把 MDR 的 内 容 送 进 指令 寄存 器 。 

在 周期 5 中， 控制 区 不 能 同时 设置 组 合 信 号 和 LoadCk 脉冲 ， 在 LoadCk 脉冲 到 达 之 前 ， 
MDR 的 内 容 必须 穿 过 复 用 器 和 ALU。 控 制 区 设计 者 必须 计算 穿 过 这 些 组 合 电路 的 门 延 迟 数 
量 ， 以 确定 在 时 钟 到 达 并 送 数 据 进入 之 前 要 等 待 多久 。 

周期 6 一 7 把 PC 加 1。 在 周期 6，A 一 7 把 PC 的 低位 字 节 放 到 ABus ; B= 23 把 常数 
1 放 到 BBus; AMux = 1 选择 让 ABus 通过 复 用 器 ; ALU = 1 选择 算术 逻辑 单元 的 A 加 B 功 
能 ， 这 样 ALU 会 把 PC 的 低位 字 节 加 1 ; CMux = 1 把 和 送 到 CBus, mE = 7 把 和 送 回 PC 
的 低位 字 节 。 在 同一 周期 ，cck 把 加 法 的 进位 送 到 C 位 。cCck Al LoadCk 都 必须 等 待 足够 长 
的 时 间 ， 使 得 数据 能 够 穿 过 周期 6 中 其 他 控制 信号 指定 的 组 合 设备 ， 然 后 才能 触发 并 把 它们 
加 载 进 寄 存 器 。 
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如 果 PC 的 低位 字 节 原来 为 1111 111 (bin)， 加 1 会 导致 向 高 位 字 节 的 进位 。 在 周期 7， 
A 一 6 把 PC 的 高 位 字 节 放 到 ABus; B = 22 把 常数 0 放 到 BBus; ALU 一 2 选 择 ALU 的 和 A 
加 B 加 Cin 功能， 把 从 低位 字 市 来 的 保存 的 进位 加 到 PC 的 高 位 字 节 上 ; CMux = 1 把 结果 
送 到 CBus ; C = 6 使 得 CBus 上 的 数据 加 载 到 PC 的 高 位 字 节 上 ， 这 个 存储 是 借助 LoadCk 
脉冲 来 完成 的 。 

在 指令 指示 符 取 出 来 之 后 ， 控 制 区 必须 对 操作 码 译 码 ， 确 定 该 指令 是 否 是 一 元 的 ， 如 果 
不 是 ， 要 获取 操作 数 指 示 符 ， 并 把 PC 加 1。 在 执行 取出 的 指令 之 前 ， 周 期 n 要 恢复 周期 1 
中 保存 的 C 位 。A = 11 把 寄存 器 Tl 放 到 ABus ; AMux = 1 把 它 送 到 ALU 的 A 输入 ; ALU = 
15 把 所 有 四 个 保存 的 状态 位 送 到 四 个 触发 胡 ; CCk 使 得 C 位 随时 钟 保 存 ， 恢 复原 始 的 值 。 

通过 把 周期 1 和 周期 3 组 合 起 来 有 可 能 减少 周期 数 。 这 样 会 删除 周期 1， 周 期 3 (重新 
编号 为 周期 2 ) 可 写作 

MemRead, CMux=0, C=11; LoadCk 
当 CPU 等 待 从 内 存 读 来 的 结果 时 ， 可 以 同时 保存 状态 位 。 

不 能 任意 组 合 控制 序列 中 的 时 钟 周期 ， 必 须 记 住 图 12-5 所 示 的 控制 序列 中 的 每 一 个 带 
编号 的 行 都 表示 一 个 CPU 周期 。 有 些 周期 依赖 于 前 一 周期 的 结果 。 例 如 ， 不 能 把 图 12-5 中 
的 周期 4 和 周期 5 组 合 到 一 起 ， 因 为 周期 5 依赖 于 周期 4 的 结果 。 周 期 4 设置 MDR 的 内 
容 ， 而 周期 5 要 使 用 MDR 的 内 容 ， 所 以 周期 $ 必须 在 周期 4 之 后 完成 。 

在 计算 机 组 成 中 硬件 并 发 是 一 个 很 重要 的 问题 。 设 计 者 总 是 保持 警觉 要 利用 硬件 并 发 来 
提高 性 能 。 当 然 ， 实 际 中 不 会 使 用 图 12-5 的 七 周期 序列 ， 因 为 合并 周期 1 和 3 能 够 不 增加 
电路 束 提 高 性 能 。 经 过 一 点 思考 ， 还 能 做 得 更 好 。 章 末 有 一 道 练习 题 要 求 把 图 12-5 中 的 周 
期 数量 从 7 减少 到 4。 

虽然 这 里 没有 给 出 控制 区 的 细节 ， 但 是 也 可 以 想象 它 会 检测 刚刚 取出 的 指令 ， 看 它 是 否 
是 一 元 指令 。 控 制 区 会 把 B 设置 为 8， 把 指令 指示 符 放 到 BBus 上 进行 检测 。 如 果 取 出 的 指 
令 不 是 一 元 的 ， 那 么 控制 区 必须 再 获取 操作 数 指示 符 ， 相 应 地 增加 PC。 获 取 操 作 数 指示 符 
和 了 PC 加 1 的 控制 序列 是 章 末 的 一 道 练习 题 。 

取 指 之 后 ， 控 制 区 会 检测 指令 指示 符 ， 决 定 要 执行 39 条 指令 中 的 哪 一 条 。 执 行 指令 的 
控制 信号 不 仅仅 取决 于 操作 码 ， 还 取决 于 寄存 器 -r 字段 和 寻 址 -aaa 字段 。 图 12-7 给 出 了 每 
种 寻 址 方式 的 操作 数 和 操作 数 指示 符 (OprndSpec ) 。 

方 括号 中 的 数字 是 内 存 地 址 。 要 执行 一 条 指令 ， 控 制 区 必须 提供 让 计算 区 计算 内 存 地 址 


的 控制 信号 。 例 如 ， 执 行使 用 变 址 寻 址 方式 的 

指令 ， 控 制 区 必须 执行 16 位 加 法 ， 用 操作 数 | 寻 址 模式 

指示 符 (寄存 器 9 和 10 ) 的 内 容 加 上 x (寄存 | 立即 数 

器 2 和 3 )。 加 法 的 结果 之 后 会 加 载 到 MAR， | 直接 

为 LDr 指令 的 内 存 读 或 STr 指令 的 内 存 写 做 LB 

好 准备 。 栈 相对 
栈 相对 间接 


图 12-5 中 实现 汉 : WI S HiT 
部 分 的 控制 序列 看 上 去 很 像 以 某 种 低级 编程 语 ee ed 
栈 变 址 


言 编 写 的 程序 。 控制 区 设计 者 的 任务 是 设计 出 栈 变 址 间接 
这 样 的 电路 ， 对 数据 区 编程 实现 ISA3 层 ( 指 oa。 


令 集 架构 层 ) 的 指令 。LG1 层 的 语言 描述 的 是 图 12-7 Pep/8 计算 机 的 寻 址 方式 
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输入 组 合 电路 中 的 二 进 制 信号 和 输入 状态 寄存 器 的 时 钟 脉冲 。 

接 下 来 的 几 个 例子 展示 了 执行 某 些 有 代表 性 的 指令 所 需 的 控制 序列 。 每 个 例子 都 假设 指 
令 已 经 取出 ，PC 也 相应 地 增加 了 。 程 序 中 的 每 条 语句 都 占 一 行 ， 每 行 都 有 编号 ， 每 条 语句 
包括 一 些 组 合 信 号 ， 让 数据 通过 复 用 器 或 选择 ALU 的 功能 ， 之 后 有 一 个 或 几 个 时 钟 脉冲 来 
加 载 一 些 寄存 器 。 记 住 ， 这 个 抽象 层次 (LGB) 上 的 程序 由 实现 更 高 抽象 层次 (ISA3 层 ) 
上 一 条 指令 所 需要 的 控制 信号 组 成 。 


12.1.3 ”实现 存储 字 节 指令 


图 12-8 给 出 执行 下 面 这 条 指令 的 控制 序列 
STBYTEA there, d 

这 里 there 是 一 个 符号 。STBYTEr 指令 的 RTL 说 明 是 
byte Oprnd ¢— r (8..15) 


这 条 指令 指明 了 采用 直接 寻 址 方式 ， 所 以 操作 数 是 Mem[OprndSpec]， 即 操作 数 指 示 符 是 操 
作 数 在 内 存 中 的 地 址 。 该 指令 把 累加 器 的 Re 
低位 字 节 存储 到 该 地 址 对 应 的 内 存单 元 。 1. A=9, B=10: MARCk 
GAS: // MDR <- A<low>. 
这 个 例子 和 后 面 的 其 他 例子 一 样 , 假 | > A=1, AMux=1, ALU=0, CMux=1, MDRMux=1; MDRCk 
设 操作 数 指示 符 已 经 在 指令 寄存 器 中 ， 也 
就 是 假设 冯 ' 诺 依 曼 周期 的 取 指 、 译 码 和 | 和 "YW 
PC 加 1 部 分 已 经 完成 。 图 12-8 只 给 出 了 
冯 “ 诺 依 曼 周 期 的 执行 部 分 。 f / si hat KONGER ME 
周期 1 把 操作 数 指 示 符 送 到 内 存 地 址 
寄存 器 。A = 9 把 操作 数 指 示 符 的 高 位 字 图 12-8 实现 使 用 直接 寻 址 方式 的 存储 
节 送 到 ABus，B = 10 把 操作 数 指示 符 的 近代 全 
低位 字 节 送 到 BBus， 而 MARCk 使 得 ABus 和 BBus 随时 钟 送 和 MAR 寄存 器 。 
周期 2 把 累加 器 的 低位 字 节 送 进 MDR。A = 1 把 累加 器 的 低位 字 节 送 到 ABus, AMux = 
1 使 数据 通过 AMux HA ALU, ALU = 0 使 数据 不 经 改变 地 通过 ALU，CMux = 1 使 数据 
通过 CBus，MDRMux = 1 使 数据 经 过 MDRMux 到 达 MDR, MDRCk 把 数据 锁 存 进 MDR 中 。 
周期 3 和 4 完成 内 存 写 ， 把 MDR 中 的 数据 存储 到 MAR 中 地 址 对 应 的 主 存 中 。 和 内 存 
读 一 样 ， 内 存 写 要 求 MemWrite 线 持续 两 个 连续 的 周期 ， 给 内 存 系统 足够 的 时 间 从 总 线 获取 
数据 并 存储 好 。 
E ISA 层 ， 存 储 指 令 不 影响 状态 位 ， 所 以 STBYTEA 的 控制 序列 中 没有 周期 会 给 NCk、 
ZCk、VCk 或 CCk 脉冲 。 





12.1.4 ”实现 加 法 指令 
图 12-9 给 出 执行 下 面 这 条 指令 的 控制 序列 
ADDA this,i 

ADDr 的 RTL 表示 为 


r&r + Oprnd; N<—r<0,Z<r=0, V € {overflow}, C <— {carry} 
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KARTS FERRE BU Bl ae Ar, FAA CE a eee PP, EA ERMA AA 
该 指令 采用 立即 数 寻 址 方式 ， 因 此 操作 数 就 是 操作 数 指示 符 。 和 前 面 一 样 ， 本 例假 设 已 经 获 
取 了 指令 指示 符 ， 并 且 存 放 在 指令 寄存 器 中 了 。 


// A<low> <- A<low> plus Oprnd<low>. Save carry. 
1. A=1, B=10, AMux=1, ALU=1, ANDZ=0, CMux=1, C=1; ZCk, CCk, LoadCk 


// A<high> <- A<high> plus Oprnd<high> plus saved carry. 
2. A=0, B=9, AMux=1, ALU=2, ANDZ=1, CMux=1, C=0; NCk, ZCk, VCk, CCk, LoadCk 





图 12-9 ”实现 使 用 立即 数 寻 址 方式 的 加 法 指令 的 控制 信和 号 


这 条 指令 会 影响 所 有 4 个 状态 位 。 虽 然 累 加 器 能 存放 16 位 值 ， 不 过 Pep/8 CPU 的 数据 
区 只 能 处 理 8 位 数字 。 要 完成 加 法 ， 控 制 序列 必须 先 把 低位 字 节 相 加 ， 保 存 低位 相 加 产生 的 
进位 ， 再 把 它 和 高 位 字 节 求 和 。 如 果 把 这 个 两 字 节 的 数字 当 作 有 符号 整数 ， 则 当 它 为 负 时 ， 
N 会 被 设置 为 1; 否则 把 N 清 零 。 最 高 位 字 节 的 符号 位 决定 N 的 值 。 如 果 两 字 节 的 数字 为 全 
0， 那 么 Z 被 设置 为 1 ; 否则 ZAAR, MA, MNES, 高 位 和 低位 字 节 的 值 共同 决定 
Z 的 值 。 

周期 1 把 累加 器 的 低位 字 节 和 操作 数 指示 符 的 低位 字 节 相 加 。A = 1 把 累加 器 的 低位 字 
节 放 到 ABus， 而 B 王 10 把 操作 数 指示 符 的 低位 字 节 放 到 BBus。AMux 天 1 把 ABus 送 到 
复 用 器 ，ALU = 1 选择 ALU 的 A 加 B 功能 ，CMux = 1 把 和 送 到 CBus, C = 1 把 ALU 的 输 
出 指向 累加 器 的 低位 字 节 准备 存储 ，LoadCck 使 之 随时 钟 存 人 累加 器 。 在 同一 周期 ，ANDZ = 
0 把 Zout 送 到 ANDZ 组 合 电 路 的 输出 ， 它 又 是 一 位 寄存 器 Z (一 个 DD 触发 器 ) 的 输入 。ZCk 
把 这 个 位 锁 存 进 寄 存 器 。 

周期 2 把 累加 器 的 高 位 字 节 加 上 操作 数 指 示 符 的 高 位 字 节 。A = 0 把 累加 器 的 高 位 字 节 
放 到 ABus， 而 B = 9 把 操作 数 指示 符 的 高 位 字 节 送 到 BBus。AMux = 1 使 ABus 经 过 复 用 
器 ，ALU = 2 选择 ALU 的 A 加 B 可 Cin 功能，CMux = 1 把 和 送 到 CBus, C = 0 把 它 指 问 
累加 器 的 高 位 字 节 准备 存储 ，LoadCk 会 在 时 钟 到 来 的 时 候 把 它 送 入 寄存 器 。ANDZ = 1 把 
Zout 与 Z 的 结果 送 到 ANDZ 组 合 电路 的 输出 ， 它 会 作为 Z 寄存 器 的 输入 。ZCk 把 这 个 位 锁 
存 进 寄 存 器 。 当 且 仅 当 Zout 和 Z 都 为 1 时 ，Z 寄存 器 的 内 容 才 会 锁 存 为 1。Z 的 值 会 随 着 周 
期 1 的 ZCk 被 保存 ， 当 且 仅 当 低位 相 加 的 和 为 全 0 的 时 候 ， 它 会 继续 保持 为 1。 所以， 当 且 
仅 当 和 的 16 位 都 为 0 时 ，Z 的 最 终 值 为 1。 其 他 3 个 状态 位 (N、V 和 C) 反映 的 是 高 位 相 
加 的 状态 ， 它们 在 周期 2 随 着 NCk、VCk 和 CCk 存储 。 


12.1.5 ”实现 装 入 指令 
图 12-10 给 出 执行 下 面 这 条 指令 的 控制 序列 


LDX this,n 
LDr 的 RTL 表示 为 
r — Oprnd; N <—r<0,Z<r=0 


RATES ALFERD eB Ek AF a AEA ETB Be PE SN, LAG 12-7 
所 示 ， 操 作 数 是 Mem[Mem[OprndSpec]]， 操 作 数 指示 符 是 操作 数 的 地 址 的 地 址 。 控 制 序列 
必须 从 内 存 中 取出 一 个 字 ， 把 它 作为 操作 数 的 地 址 ， 还 需要 再 取 一 次 才能 得 到 操作 数 。 
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T3<high> <- Mem[LOprndSpec]. 
. A=9, B=10; MARCk 
. MemRead 
. MemRead, MDRMux=0; MDRCk 
. AMux=0, ALU=0, CMux=1, C=14; LoadCk 


T2 <- OprndSpec + 1. 
5. A=10, B=23, AMux=1, ALU=1, CMux=1, C=13; CCk, LoadCk 
. A=9, B=22, AMux=1, ALU=2, CMux=1, C=12; LoadCk 


T3<low> <- Mem[T2]. 
7. A=12, B=13; MARCk 
. MemRead 
. MemRead, MDRMux=0; MDRCk 
. AMux=0, ALU=0, CMux=1, C=15; LoadCk 


Assert: T3 contains the address of the operand. 
X<high> <- Mem[T3]. 

. A=14, B=15; MARCk 

. MemRead 

. MemRead, MDRMux=0; MDRCk 

. AMux=0, ALU=0, ANDZ=0, CMux=1, C=2; NCk, ZCk, LoadCk 


T4 <- T3 + 1. 
. A=15, B=23, AMux=1, ALU=1, CMux=1, C=17; CCk, LoadCk 
. A=14, B=22, AMux=1, ALU=2, CMux=1, C=16; LoadCk 


X<low> <- Mem[T4] . 

. A=16, B=17; MARCk 

. MemRead 

. MemRead, MDRMux=0; MDRCk 

. AMux=0, ALU=0, ANDZ=1, CMux=1, C=3; ZCk, LoadCk 


Restore C, assumed in Tl from Fetch. 
. A=11, AMux=1, ALU=15; CCk 





图 12-10 ”实现 使 用 间接 寻 址 方式 的 装 和 人 指令 的 控制 信号 


图 12-11 给 出 执行 图 12-10 的 控制 序列 的 效果 ,假设 符号 this 的 值 为 0x0012， 内 
存 的 初始 值 如 地 址 0012 和 26D1 所 示 。Mem[0012] 的 值 为 0x26D1， 这 是 操作 数 的 地 址 。 
Mem[26D1] 是 操作 数 ， 值 为 0x$3AC， 这 条 指令 就 是 要 把 它 加 载 进 变 址 寄存 器 。 该 图 显示 
了 这 个 控制 序列 影响 的 每 个 寄存 器 的 地 址 。 指 令 寄 存 器 的 第 一 个 字 节 CA 是 采用 间接 寻 址 的 
LDX 指令 的 指令 指示 符 。 

周期 1 一 4 把 Mem[OprndSpec] 传送 到 临时 寄存 器 T3 的 高 位 字 节 。 在 周期 1, A 二 9 和 
B = 10 把 操作 数 指示 符 分 别 放 到 ABus 和 BBus， 而 MARCK 用 时 钟 把 它们 送 进 内 存 地 址 寄存 
器 。 在 周期 2，MemRead 发 起 一 个 内 存 读 ， 周 期 3 会 完成 该 操作 。 周 期 4 按照 通常 的 方式 把 
数据 从 MDR 送 到 T3 的 高 位 字 节 。 | 

周期 5 ~ 6 把 操作 数 指示 符 加 1， 并 把 结果 存储 在 临时 寄存 器 T3 中 。 周 期 5 把 操作 数 
指示 符 的 低位 字 节 加 1， 周 期 6 会 把 低位 字 节 相 加 可 能 产生 的 进位 考虑 进 高 位 字 节 加 法 中 。 

周期 7 ~ 10 使 用 T2 中 计算 出 来 的 地 址 获取 操作 数 地 址 的 低位 字 节 。 周 期 7 把 工 2 的 内 
容 放 到 内 存 地 址 寄存 器 。 周 期 8 发 起 内 存 读 ， 周 期 9 把 这 个 字 节 从 内 存 锁 存 进 MDR 中 。 周 
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期 10 把 这 个 字 节 从 MDR 经 过 AMux 送 进 T3 的 低位 字 节 。 

此 时 ， 可 以 断言 临时 寄存 器 T3 包含 操作 数 的 地 址 0x26D1。 最 后 ， 可 以 获取 操作 数 的 
第 一 个 字 节 ， 把 它 加 载 进 变 址 寄存 需 的 第 一 个 字 节 。 周 期 11 ~ 14 执行 加 载 过 程 。LDr 的 
RTL 说 明 表 明 这 条 指令 会 影响 N 和 Z 位 。N 位 是 由 最 高 字 节 的 符号 位 决定 的 。 所 以 ， 周 期 
14 包括 时 钟 脉冲 NCk， 把 经 过 ALU 的 字 节 存 进 N 位 。Z 位 取决 于 两 个 字 节 的 值 ， 所 以 周期 
14 包括 ANDZ = 0 Al zck, LAGE Zout 信和 号 保存 到 Z 寄存 器 。 

周期 15 ~ 16 把 第 一 个 字 节 的 地 址 加 





CPU 

1， 并 把 结果 保存 到 临时 寄存 器 T4。 要 获 8 
取 操 作 数 的 第 二 个 字 节 ， 周 期 17 ~ 20 把 | S| 
增加 过 的 地 址 从 T4 保存 到 内 存 地 址 寄存 ae 
器 。 周 期 20 最 后 会 把 第 二 个 字 节 放 到 变 ma 
址 寄存 器 。 它 包括 ANDZ = 1， 这 样 来 自 T2| 00 | B | 
低位 字 节 的 Z 值 (在 周期 14 存储 的 ) 会 Ee 
和 来 自 高 位 字 节 的 Zout 与，ZCk 会 存储 14 _15 
该 指令 加 载 进来 的 16 位 数字 的 正确 的 Z。 ii 

装 和 人 指令 不 应 该 影响 V 或 C 位 。 不 幸 | ern 
的 是 ， 在 各 种 地 址 增加 的 处 理 中 C 位 会 改 ame — 
变 好 几 次 。 所 幸 的 是 冯 . 诺 依 曼 周期 的 取 T4 
指 部 分 会 把 所 有 四 个 状态 位 保存 在 临时 寄 人 
存 器 T1， 就 像 图 12-5 的 周期 1 显示 的 那 一 一 
样 。 可 以 假设 在 这 期 间 T1 没有 被 算 改 过 。 a ae 
图 12-11 中 的 周期 21 会 相应 地 恢复 C 位 。 ucla vii 


图 12-5 对 冯 … 诺 依 曼 周 期 的 取 值 和 
PC 增加 部 分 的 性 能 进行 了 优化 ， 用 同样 图 12-11 执行 图 12-10 的 控制 序列 的 结果 
方法 也 可 以 优化 图 12-10 的 控制 序列 。 章 末 的 一 道 练 习题 要 求 把 图 12-10 的 时 钟 周 期 从 21 
降低 到 17。 


12.16 ”实现 算术 右 移 指令 
图 12-12 给 出 执行 这 条 一 元 指令 的 控制 序列 
ASRA 
ASRr 指令 的 RTL 表示 为 
C e r(15), r(1..15) — (0.14) :Ner<0,Zer=0 
ASRr 指令 是 一 元 的 ， 没 有 内 存 访问 ， 这 使 得 控制 序列 很 简短 。 


// Arithmetic shift right of high-order byte 
1. A=0, AMux=1, ALU=13, ANDZ=0, CMux=1, C=0; NCk, ZCk, CCk, LoadCk 


// Rotate right of low-order byte 
2. A=1, AMux=1, ALU=14, ANDZ=1, CMux=1, C=1; ZCk, CCk, LoadCk 


图 12-12 ”实现 一 元 ASRA 指令 的 控制 信号 


因为 ALU 只 能 计算 8 位 数字 ， 所 以 必须 要 把 16 位 位 移 分 解 成 两 个 8 位 运算 。 图 12-13 
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给 出 四 个 ALU 执行 的 移 位 和 循环 操作 。 要 做 算术 右 移 ， 控 制 序 列 对 高 位 字 节 做 算术 右 移 ， 
再 对 低位 字 节 做 循环 右 移 。 


Cout Cout 


a) ARAB (ASR) b) 循环 右 移 ( ROR ) 


d 砚 隐 网 


TET TITTY OTT 


Cout | 
c) 循环 左 移 (ROL) d) 算术 左 移 ( ASL) 


图 12-13 Pep/8 ALU 执行 的 算术 和 循环 操作 


周期 1 中 ，A 王 0 把 累加 器 的 高 位 字 节 放 到 ABus，AMux = 1 把 它 送 到 ALU，ALU = 13 
选择 算术 右 移 运算 ，CMux = 1 和 Cc = 0 把 结果 送 到 累加 器 准备 存储 ， 而 LoadCk 会 存储 它 。 
ANDZ = 0 把 位 移 运 算 的 Zout 送 到 ZZ 寄存器， 而 ZCk 会 保存 它 。NCk 会 存储 来 自 高 位 运算 
的 NN 位， 这 是 最 终 的 值 。CCk 会 保存 来 自 高 位 运算 的 C 位 ,但 这 不 是 C 的 最 终 值 。 

周期 2 中 ,A = 1 把 累加 器 的 低位 字 节 放 到 ABus，AMux = 1 把 它 送 到 ALU，ALU = 
14 选择 循环 右 移 运算 ，CMux = 1 AC 一 1 把 结果 送 到 累加 上 需 准 备 存储 ， 而 LoadCk 会 存储 
这 个 结果 。ANDZ 会 使 得 ANDZ 组 合 电路 执行 Zout 和 的 与 操作 ，ZzCck 会 把 这 个 结果 存储 
到 Z 中 作为 最 终 值 。CCk 会 存储 Cout 作为 C 的 最 终 值 。 


12.2 ”性 能 问题 


从 理论 的 角度 ， 所 有 真实 的 冯 ，: 诺 依 曼 计算 机 器 的 计算 能 力 都 是 相同 的 。 给 定 一 种 机 
制 将 有 限 容量 的 磁盘 存储 与 一 台 机 器 相连 接 ， 这 在 计算 能 力 上 等 价 于 图 灵机 。 在 计算 能 力 方 
面 ，Pep/8 和 世界 上 最 大 的 超级 计算 机 之 间 唯 一 的 差别 是 计算 占用 的 时 间 。 为 了 计算 出 一 个 
问题 的 解答 ，Pep/8 可 能 需要 一 百 万 年 ， 超 级 计算 机 可 能 只 需要 1 毫秒 ， 但 是 理论 上 它们 可 
以 做 同样 的 事情 。 

从 实际 的 角度 ， 时 间 很 重要 。 在 所 有 其 他 条 件 相 同 的 情况 下 ， 越 快 越 好 。 虽 然 LG1 层 
图 12-2 的 数据 区 可 以 实现 ISA3 层 的 Pep/8， 问 题 是 ， 速 度 有 多 快 ? 本 节 描 述 加 速 计 算 的 技 
术 。 提 高 性 能 有 两 个 根本 原因 : 

e 空间 /时 间 折 中 

e 并 行 

时 间 /空间 折 中 是 指 通过 增加 电路 (这 会 在 集成 电路 上 占用 空间 ) 来 降低 计算 时 间 。 在 
控制 序列 中 合并 周期 是 一 种 形式 的 硬件 并 行 ， 重 新 组 织 控 制 区 使 得 集成 电路 上 可 以 有 更 多 的 
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子 系统 并 发 地 运行 ， 这 也 可 以 提高 并 行 度 。 
12.2.1 总 线 宽度 ， 


用 空间 / 时 间 折 中 来 提高 性 能 的 最 直接 方法 是 增加 寄存 器 和 总 线 的 宽度 ， 这 要 求 整 个 集 
成 电路 都 增加 宽度 。 

例如 ， 在 ISA3 层 ，Pep/8 是 一 个 16 位 的 机 器 ， 也 就 是 说 保存 数据 的 寄存 器 〈 例 如 累加 
器 ) 和 保存 地 址 的 寄存 器 (例如 PC) 都 是 16 位 宽 的 。 因 为 PC 通过 MAR 连接 到 主 系统 总 
线 ， 所 以 地 址 总 线 也 是 16 位 宽 。 所 有 运算 都 是 对 16 位 数字 的 运算 。 要 提高 性 能 ， 可 以 把 数 
据 区 总 线 (ABus、BBus、CBnus 及 其 他 ) 的 数据 总 线 宽度 从 8 位 提高 到 16 位 。 把 数据 区 总 
线 从 8 位 提高 到 16 位 会 带 来 性 能 的 极 大 提升 。 所 有 需要 两 个 周期 才能 处 理 完 的 指令 (一 个 
周期 处 理 高 位 字 节 ， 一 个 周期 处 理 低位 字 节 ) 都 只 需要 一 个 周期 了 。 

不 过 还 是 有 一 些 问题 。 因 为 MDR 要 和 AMux 输入 保持 一 致 ， 所 以 要 把 它 也 变 成 16 位 
宽 。 所 以 该 怎么 访问 内 存 呢 ? 如 果 主 系统 总 线 有 16 根 数据 线 ， 那 么 主 存 就 不 再 是 按 字 节 寻 
址 的 了 ? 另 一 个 问题 是 ， 该 如 何 重组 寄存 器 体 里 的 寄存 器 呢 ? 假设 所 有 寄存 器 都 是 16 位 宽 ， 
那么 一 个 字 节 的 指令 指示 符 该 怎么 存放 在 IR 中 呢 ? 

实际 上 现在 所 有 计算 机 都 是 按 字 节 寻 址 的 ， 但 是 主 系统 总 线 也 不 止 八 条 数据 线 。 它 们 的 
工作 方式 是 省 略 最 低 的 几 位 寻 址 位 ， 位 数 与 数据 总 线 的 宽度 相对 应 。 图 12-14 展示 了 这 种 方 
法 是 怎样 应 用 到 具有 16 位 MDR 的 Pep/8 上 的 。 图 12-14a 对 应 于 图 12-2， 其 中 有 16 条 地 址 
线 和 8 条 数据 线 。 在 图 12-14b 中 ，MDR 是 16 位 宽 ， 数 据 线 的 数量 翻 倍 ， 而 少 了 地 址 线 AO. 


AQ 一 一 > <> D0 <> DO 
Al 一 一 起 -一 > 也 ] Al —> <—> DI 
A2 一 一 ”> <> D2 A2—~> <> D2 
A3 一 一 > <> D3 A3 一 一 > <> D3 
A4 —> <> D4 A4 一 一 > <—> D4 
AS 一 一 > <> D5 A5 一 一 > <-> D5 
A6 一 一 <->» D6 A6 一 一 > <> D6 
A7 一 一 > <> D7 A7 一 一 > <> D7 
A8 一 一 > A8 一 一 <—> D8 
A9 一 一 > A9 一 一 > <> D9 
A10 一 一 > A10 一 一 > <-> D10 
All — All—>»> <—> DI! 
A12 —> A12 —> <—> DI2 
A13 一 一 > A13 一 -一 > <—> D13 
人 14 一 一 > A14 一 一 二 <> D14 
A15 一 一 > A15 —> tD 
MemR  MemW MemR MemW 


a) 图 12-2 的 心 请 b) 具有 16 位 数据 总 线 的 芯片 


图 12-14 Pep/8 内 存世 片 的 输出 引 脚 图 


假设 CPU 请 求 在 地 址 OAS7 Chex) 的 字 节 ， 这 个 地 址 的 二 进 制 表示 是 0000 1010 0101 
0111 (bin)。 送 到 内 存 子 系统 的 地 址 请 求 是 0000 1010 0101 0110， 最 后 一 位 为 0， 因为 不 需 
要 A0。 系 统 返 回 地 址 0A56 和 0A57 的 两 个 字 节 。CPU 必须 从 两 个 字 节 的 字 中 抽取 出 它 想 
要 的 字 节 。 这 种 方式 的 好 处 是 当 CPU 想 要 一 个 两 字 节 的 字 时 ,例如 请 求 位 于 1BD6 的 字 时 ， 
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只 需要 一 次 访问 就 能 得 到 两 个 字 节 。 

不 过 现在 又 有 一 个 问题 了 。 假 设 CPU 想 要 位 于 地 址 1BD5 的 字 ， 这 个 地 址 是 一 个 奇数 。 
这 会 要 求 两 次 访问 : 一 次 取出 1 BD4， 抽 取出 第 二 个 字 节 ; 一 次 取出 1 BD6， 抽 取出 第 一 个 
字 节 。 这 就 没有 加 速 的 优势 了 ， 因 为 想 要 取 的 数 的 地 址 不 是 偶数 。 一 个 更 典型 的 系统 是 四 字 
节 数 据 总 线 ， 没 有 AO 和 A1l。 对 于 一 个 要 求 1、2、3 或 4 个 字 节 的 内 存 请 求 ， 这 些 字 节 都 
落 在 地 址 可 以 被 4 整除 的 四 字 节 边界 里 ， 那 么 一 次 内 存 访问 就 能 满足 。 这 对 性 能 的 提高 很 
大 ， 所 以 大 多 数 汇 编 语言 都 有 特殊 的 点 命令 ， 使 程序 员 可 以 强迫 目标 代码 必须 地 址 对 齐 ， 以 
减 小 内 存 访问 时 间 。 

可 以 看 到 增加 总 线 宽度 对 芯片 大 小 有 很 大 影响 。 所 有 的 电路 ， 包 括 ALU、 复 用 器 和 寄 


存 器 ， 都 必须 增加 以 和 总 线 匹 配 。 计 算 机 的 历史 显示 
, 7 R 日 期 | 寄存 器 宽度 
CPU 如 何 把 总 线 宽 度 从 4 位 增加 至 32 位 。4004 是 第 008 | 1972 | si | 
6bit | 


一 个 片上 微 处 理 器 ， 接 下 来 演变 中 的 一 大 步 是 从 32 位 oan 
机 器 到 64 (ALAS. BAR SHR LEA AIRS aA 
64 位 的 寄存 器 和 总 线 已 经 很 多 年 了 ， 但 是 这 个 大 小 的 

CPU 在 桌面 机 器 上 才刚 刚 开 始 出 现 。 图 12-15 历史 上 的 寄存 做 / 总 线 宽度 

带 来 这 种 变化 的 原因 可 能 仅仅 是 技术 以 一 种 稳定 的 速度 在 发 展 。Gordon Moore, Intel 
的 创始 人 ， 在 1965 年 观察 到 集成 电路 上 晶体 管 的 密度 每 年 都 会 翻番 ， 而 且 在 可 预见 的 未 来 
还 会 继续 如 此 。 这 个 速度 现在 有 些 减缓 了 ， 所 谓 的 摩尔 定律 (Moore’s Law) 是 指 集成 电路 
上 晶体 管 的 密度 每 18 个 月 会 翻番 。 这 个 速度 不 会 永远 保持 ， 因 为 这 种 变 小 化 最 终 会 到 达 原 
子 的 尺度 ， 而 原子 是 无 法 再 分 割 的 了 。 人 们 一 直 在 热烈 讨论 摩尔 定律 具体 什么 时 候 会 停止， 
许多 人 预测 它 会 消亡 ， 结 果 发 现 它 还 在 继续 。 

得 到 普遍 接受 的 “nn 位 计算 机 ”的 意思 是 nn 为 MAR 和 在 ISA3 层 可 见 的 CPU 寄存 器 的 
位 数 。 因 为 I SA3 层 可 见 的 寄存 器 可 以 存放 地 址 ， 它 们 的 宽度 通常 和 MAR 一 样 ， 所 以 这 个 
定义 没有 歧义 。 关 于 这 个 定义 的 疑虑 经 常 出 现在 市 场 上 。n 位 计算 机 的 主 系统 总 线 不 一 定 有 
n 条 地 址 线 ，CPU 的 数据 区 也 不 一 定 有 nn 位 数据 总 线 ，LG1 层 的 寄存 器 体 也 不 一 定 有 nn 位。 
这 些 宽度 都 可 以 小 于 n。 进 一 步 说 ， 使 用 图 12-14b 中 的 技术 ， 主 系统 总 线 中 数据 线 的 数量 
可 以 大 于 n。 

一 个 经 典 的 例子 是 1964 年 开始 的 IBM 360 系列 ， 这 是 第 一 个 计算 机 系列 ， 它 们 的 模型 
具有 同样 的 ISA3 指令 集 和 寄存 器 。 它 是 32 位 机 器 ， 但 是 根据 模型 的 不 同 ，CPU 中 的 数据 
总 线 可 以 是 8 位 、16 位 和 32 位 。 因 为 LG1 层 细 节 对 ISA3 层 的 程序 员 是 屏蔽 的 ， 所 以 在 系 
列 中 某 个 模型 上 编写 和 调试 的 所 有 软件 都 可 以 在 另 一 个 模型 上 运行 ， 无 须 改变 。 唯 一 可 以 感 
觉 到 的 模型 之 间 的 区 别 是 以 执行 时 间 测 量 的 性 能 。 这 个 概念 在 当时 是 革命 性 的 ， 基 于 抽象 层 
次 的 概念 提升 了 计算 机 的 设计 。 

处 理 器 系列 中 新 的 芯片 经 常 没有 完整 的 地 址 线 能 匹配 可 寻 址 字 节 数 










MAR 的 宽度 。MAR 的 宽度 是 CPU 最 多 能 访问 的 主 存 字 | 8 
PAER, QA 12-16 所 示 ，16 位 计算 机 的 最 大 限制 是 64 
KB。 当 操作 系统 和 应 用 程序 需要 更 多 内 存 时 ， 唯 一 的 方法 
是 增加 MAR 的 宽度 。 我 们 现在 也 受到 同样 的 制约 。 推 动 
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64K 
4G 





64 位 计算 机 的 最 大 动力 是 因为 多 媒体 应 用 和 大 型 数据 库 需 图 12-16 最 大 内 存 限 制 
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要 大 于 4 GB 的 地 址 空间 。64 位 计算 机 可 能 是 最 后 的 诉求 ， 因 为 64 位 地 址 线 可 以 访问 160 
亿 GB。 从 一 代 到 下 一 代 的 增长 不 是 线性 的 ， 而 是 指数 性 的 。 曾 经 有 很 多 年 ，32 位 计算 机 有 
32 位 的 MAR， 但 是 主 存 总 线 只 有 24 条 线 ， 高 位 的 8 个 地 址 位 被 忽略 。 用 户 可 以 在 这 样 的 
机 器 上 安装 最 多 16MB (2”) 内 存 ， 这 在 当时 已 经 足够 大 了 。 未 来 在 64 位 计算 机 上 也 是 一 
样 的 ， 根 据 市 场 需要 ， 外 部 地 址 线 的 数量 会 小 于 MAR 的 内 部 宽度 。 


12.2.2 ”特殊 的 硬件 单元 


利用 空间 /时 间 折 中 技术 还 有 另 一 种 方式 ， 因 为 改进 硬件 系统 的 性 能 就 要 确定 性 能 瓶 
贷 ， 所 以 可 以 设计 特殊 的 硬件 单元 来 缓解 瓶 代 。 比 起 增加 整个 系统 总 线 带 宽 的 粗暴 方法 ， 这 
种 方法 更 像 是 手术 式 的 ， 只 花费 增加 全 部 总 线 带 宽 所 需 成 本 的 一 部 分 ， 就 可 能 获得 巨大 的 性 
能 提升 。 

图 12-10 正 是 这 样 一 种 情况 ， 是 实现 LDX this,n 的 控制 序列 。 你 可 能 已 经 注意 到 了 ， 
需要 好 几 个 周期 来 完成 地 址 加 1， 因 为 需要 访问 内 存 中 相 邻 的 下 一 个 位 置 的 字 节 。 这 需要 三 
个 周期 : 1 ) 地 址 的 低位 字 节 加 1 ; 2 ) 高 位 字 节 加 总线 
上 可 能 的 进位 ; 3) 把 两 字 节 字 传 送 到 MAR。 周 
期 5、6 和 7 就 是 这 样 的 例子 。 

问题 是 ALU 是 一 个 通用 目的 设备 ， 用 来 对 8 
位 数字 做 多 种 运算 。 要 缓解 这 个 瓶 贷 ， 需要 一 个 
特殊 目的 的 电路 来 进行 1 加 上 一 个 16 位 数字 的 操 
作 。 图 12-17 展示 的 是 一 种 可 能 性 。 在 A 和 B 总 
线 与 MAR 之 间 插 入 一 个 组 合 电 路 ， 这 个 组 合 电 路 
有 来 自 MARA 和 MARB 的 反馈 。 控制 线 标号 为 
MARInc， 工 作 方式 如 下 : 图 12-17 对 MAR 加 1 的 特殊 的 硬件 单元 

e MARInc = 0, ABus 和 BBus 不 经 改变 地 通过 。 

e MARInc = 1, MAR + 1 的 16 位 和 通过 。 

增 量 器 (incrementer) 黑 盒子 的 设计 作为 章 末 的 一 道 练习 题 。 图 12-18 给 出 的 是 实现 采用 间 
接 寻 址 方式 的 装 入 指令 的 控制 信号 ， 使 用 的 是 图 12-17 中 的 地 址 增 量 器 。 


// T3<high> <- Mem[OprndSpec]. 

// MAR <- OprndSpec + 1. 

1. A=9, B=10, MARInc=0; MARCk 

2. MemRead 

3. MemRead, MDRMux=0, MARInc=1; MDRCk, MARCk 

4. MemRead, AMux=0, ALU=0, CMux=1, C=14; LoadCk 


MARInc 





// T3<low> <- Mem[OprndSpec + 1]. 
5. MemRead, MDRMux=0; MDRCk 
6. AMux=0, ALU=0, CMux=1, C=15; LoadCk 


// Assert: T3 contains the address of the operand. 
// X<high> <- Mem[{T3]. 

// MAR <- T3 + 1. 

7. A=14, B=15, MARInc=0; MARCk 

8. MemRead 
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9. MemRead, MORMux=0, MARInc=1; MDRCk, MARCk 
10. MemRead, AMux=0, ALU=0, ANDZ=0, CMux=1, C=2; NCk, ZCk, LoadCk 


// X<low> <- Mem[T3 + 1]. 
11. MemRead, MDRMux=0; MDRCk 
12. AMux=0, ALU=0, ANDZ=1, CMux=1, C=3; ZCk, LoadCk 





图 12-18 (2%) 


每 次 加 载 MAR 都 要 记得 指定 MARInc。 在 周期 3， 可 以 在 加 载 MDR 的 同时 增加 
MAR， 因 为 这 两 个 操作 不 需要 数据 区 中 相同 的 资源 。 主 - 从 设计 保证 MAR 中 的 变化 不 会 影 
响 当 前 内 存 读 的 地 址 线 。 周 期 9 也 利用 了 同样 的 推理 。 在 周期 4 和 10， 可 以 开始 下 一 个 读 ， 
因为 在 前 一 个 周期 数据 已 经 随 着 时 钟 进入 MAR 了 。 地 址 增 量 器 带 来 的 另 一 个 好 处 是 不 使 用 
C 位 ， 所 以 不 需要 恢复 它 。 把 图 12-10 中 的 时 钟 合 并 一 下 ， 可 以 得 到 总 共 17 个 周期 。 使 用 
地 址 增 量 占 把 时 钟 周期 数 从 17 减少 到 12, E T 5/17=29% 的 时 间 。 

地 址 增 量 器 把 地 址 字 作 为 一 个 16 位 的 数字 来 处 理 ， 从 而 减少 了 周期 数 。 要 想 在 数据 处 
理 上 取得 同样 的 进展 ， 需 要 特殊 目的 的 硬件 ， 它 也 以 16 位 为 单位 访问 内 存 。 在 上 面 的 控制 
序列 中 ， 周 期 1 一 4 访问 一 个 字 的 高 位 字 节 ， 周 期 5 一 7 访问 低位 字 节 。 如 果 把 图 12-14b 
的 主 系统 总 线 上 的 数据 线 数量 翻 倍 ， 一 次 内 存 操作 就 能 访问 整个 字 了 。 要 做 到 这 点 ， 需 要 一 
个 两 字 节 的 MDR。 

进一步 来 说 ， 如 果 要 求 所 有 地 址 和 所 有 两 字 节 字 操 作 数 都 存储 在 偶数 地 址 ， 那 么 可 以 不 
使 用 地 址 增 量 器 了 ， 因 为 它 唯一 的 目的 是 优化 对 连续 字 节 的 内 存 访问 。 如 果 一 次 访问 能 获得 
两 个 字 节 ， 那 就 不 再 需要 它 了 。 要 想 这 个 方案 能 够 行 得 通 ， 汇 编 器 必须 包含 对 齐 点 命令 ， 强 
人 迫 地 址 和 两 字 节 字 操 作 数 的 目标 代码 存放 在 偶数 地 址 。 这 个 要 求 也 适用 于 全 局 变量 和 运行 时 
栈 上 的 局 部 变量 。32 位 计算 机 要 求 数据 存储 在 能 被 4 整除 的 地 址 ， 而 64 位 计算 机 要 求 地 址 
能 被 8 整除 。 

图 12-18 的 控制 序列 还 显示 了 一 个 瓶颈 ， 这 个 问题 可 以 通过 修改 数据 区 的 通路 来 减轻 。 
临时 寄存 器 T3 的 唯一 目的 是 在 被 送 到 MAR 之 前 保存 从 内 存 获取 的 地 址 。 如 果 有 16 位 的 数 
据 通 路 直接 从 MDR 到 MAR， 就 可 以 省 掉 把 地 址 放 到 T3 再 送 到 MAR 的 那些 周期 。 

在 图 12-19 中 有 两 个 MDR 寄存 器 : MDRO 保存 在 偶数 地 址 的 字 节 的 内 容 ， 而 MDRI1 保 
存在 奇数 地 址 的 字 节 。 每 个 寄存 器 都 是 通过 自己 的 复 用 器 从 CBus 加 载 进来 的 。 还 有 一 个 额 
外 的 标号 为 01Mux 的 复 用 器 选择 要 把 哪个 MDR 送 到 数据 区 的 主 数据 通路 上 。 和 通常 情况 
下 一 样 ，01Mux 控制 线 为 0 使 MDR0 通过 复 用 器 。 还 有 一 条 数据 通路 从 两 字 节 MDR 到 两 
字 节 MAR， 中 间 经 过 标号 为 MARMux 的 复 用 器 。 这 个 复 用 需 控 制 线 选择 数据 的 原则 是 : 

。 MARMux 为 0 使 得 MDR 送 到 MAR. 

èe MARMux 为 1 使 得 ABus 和 BBus 送 到 MAR。 

图 12-20 展示 了 和 采用 间接 寻 址 方式 的 装 人 指令 的 控制 序列 。 与 图 12-10 不 同 ， 它 假设 地 
址 字 和 两 字 节 数据 字 都 是 对 齐 的 。 这 个 控制 序列 需要 8 个 周期 ， 在 原始 序列 17 个 周期 的 基 
础 上 有 53% 的 改进 。 这 个 节省 比例 比 使 用 地 址 增 量 器 时 大 ， 但 是 对 设计 也 有 很 大 影响 。 增 
加 主 系 统 总 线 的 数据 线 影响 内 存 子 系统 和 CPU 芯片 的 地 址 输出 引 脚 。 同 时 ， 内 存 对 齐 要 求 
对 汇编 语言 程序 也 有 影响 ， 并 且 使 得 运行 时 栈 的 存储 更 加 复杂 。 不 过 现在 大 多 数 CPU 的 设 
计 都 有 这 个 要 求 ， 因 为 带 来 的 性 能 回报 很 高 。 为 了 保持 程序 简单 ，Pep/8 汇编 语言 没有 对 齐 
要 求 。 
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图 12-19 图 12-14b BY 2 字 节 数据 总 线 的 特殊 硬件 单元 


MDR <- Mem[OprndSpec]. 
. A=9, B=10, MARMux=1; MARCk 
. MemRead 
. MemRead, MDROMux=0, MDR1Mux=0; MDROCk, MDR1Ck 


MAR <- MDR. 
4. MARMux=0; MARCk 


MDR <- two-byte operand. 
5. MemRead 
. MemRead, MDROMux=0, MDR1Mux=0; MDROCk, MDR1CK 


X <- MDR, high-order first. 
7. OlMux=0, AMux=0, ALU=0, ANDZ=0, CMux=1, C=2; NCk, ZCk, LoadCk 
. OlMux=1, AMux=0, ALU=0, ANDZ=1, CMux=1, C=3; ZCk, LoadCk 





图 12-20 用 图 12-19 的 2 字 节 数据 总 线 实现 采用 间接 寻 址 方式 的 装 人 指令 的 控制 信和 号 


12.2.3 3 个 优化 领域 
衡量 一 台 机 器 性 能 的 最 终 指标 是 它 执行 起 来 有 多 快 。 图 12-21 说 明 机 器 执行 程序 的 时 间 
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是 三 个 因子 的 乘积 。 等 式 中 使 用 的 “指令 ” 指 的 是 ISA3 层 的 指令 。 

前 两 个 因子 之 间 有 关联 ， 但 是 与 第 三 个 因子 无 关 。 第 一 个 因子 下 降 通 常会 导致 第 二 个 因子 
上 升 ， 反 之 亦 然 。 也 就 是 说 ， 如 果 设 计 时 间 “指令 “周期 “时间 
ISA3 机 器 的 方法 导致 书写 一 个 给 定 程序 的 程序 ”程序 ”指令 ”周期 
指令 数 减 少 ， 那 么 通常 会 付出 执行 每 条 指 
令 的 周期 数 增加 的 代价 。 反 过 来 ， 如 果 设 
计 1SA3 机 器 导致 每 条 指令 使 用 的 周期 数 
尽 可 能 少 ， 通 常 就 必须 让 指令 尽量 简单 ， “| 码 帮 助 实现 存储 体系 结构 帮助 实现 
使 得 编写 一 个 给 定 的 程序 需要 更 多 的 指令 。 a Pe 

Sue Ae OA a 
的 ， 需 要 重新 组 织 控制 区 ， 使 得 集成 电路 上 更 多 的 子 系统 能 够 并 发 地 运行 。 不 过 ， 它 和 前 面 
两 个 因子 之 间 没 有 折 中 关系 。 可 以 在 设计 中 引入 流水 线 ， 降 低 每 个 周期 的 时 间 ， 每 个 程序 所 
需 的 时 间 都 会 降低 ， 不 管 选 择 以 第 二 个 因子 为 代价 减 小 第 一 个 因子 ， 还 是 以 第 一 个 因子 为 代 
价 减 小 第 二 个 因子 。 

在 计算 历史 的 早期 ， 设 计 者 的 注意 力 集中 于 第 一 个 因子 。 采 用 这 种 方法 的 部 分 原因 是 内 
存 的 成 本 太 高 。 程 序 需要 尽 可 能 小 ， 才 能 装 进 可 用 的 内 存 中 。 指 令 集 和 寻 址 方式 的 设计 需 使 
编译 器 能 很 容易 地 从 HOL6 翻译 到 Asmb5。Pep/8 就 是 这 种 设计 的 示例 。 而 这 里 主要 是 出 于 
教学 的 原因 ， 而 不 是 因为 内 存 有 限 。 汇 编 语 言 用 于 讲授 计算 机 系统 中 典型 抽象 层级 之 间 的 翻 
译 原 理 。 翻 译 过 程 简 单 的 话 ， 这 些 原理 学 习 起 来 就 容易 。 

在 20 世纪 80 年 代 早 期 ， 计 算 领 域 发 生 了 变化 。 硬 件 变 得 越 来 越 便 宜 ， 内 存 子 系统 变 得 
越 来 越 大 。 一 些 设计 者 ， 著 名 的 有 IBM 的 John Cocke, UC Berkeley 的 David Patterson 和 
Stanford 的 John Hennessy， 开 始 宣扬 基于 以 增加 第 一 个 因子 、 降 低 第 二 个 因子 为 基础 的 设 
计 。 他 们 的 设计 特点 是 ISA3 指令 的 个 数 很 少 ， 寻 址 方式 也 较 少 。 这 种 设计 的 名 称 是 精简 指 
令 集 计算 机 (Reduced Instruction Set Computer，RISC )。 与 之 相对 的 旧 设 计 开 始 称 作 复杂 指 
令 集 计算 机 (Complex Instruction Set Computer，CISC ) 。 因 为 前 两 个 因子 之 间 有 折 中 关系 ， 
所 以 许多 人 怀疑 最 终 的 净 结 果 能 否 得 到 更 快 的 计算 机 。RISC 的 观点 是 这 样 可 以 在 给 定 的 集 
成 电路 上 比 CISC 设计 获得 更 高 的 并 行 度 ， 尤 其 是 使 用 流水 线 的 时 候 。 

从 20 世纪 80 年 代 以 来 ， 几 乎 所 有 新 设计 的 CPU 都 是 RISC 机 器 ， 其 中 最 著名 的 有 : ARM 
芯片 ， 在 手机 市 场 占 据 主 导 ; MIPS 芯片 ， 基 于 Stanford 设计 ， 用 在 服务 器 和 任天堂 的 游戏 控 
制 器 中 ; Sparc 芯片 ， 基 于 Berkeley 设计 ，Sun 将 其 用 于 服务 器 和 工作 站 ; 还 有 PowerPC， 
基于 IBM 设计 ， 用 在 IBM 服务 器 和 工作 站 中 。 不 过 ， 还 有 一 种 CISC 设计 继续 主导 看 果 面 
市 场 ， 那 就 是 Intel 的 IA-32， 其 是 图 12-15 列 出 的 芯片 的 直接 继承 者 。 它 能 够 继续 主导 主要 
是 因为 与 系列 中 以 前 的 所 有 芯片 都 兼容 。 把 应 用 程序 和 操作 系统 迁移 到 具有 不 同 ISA3 指令 
和 寻 址 方式 的 芯片 上 代价 是 很 高 的 。 而 且 ，CISC 设计 者 采用 了 RISC 的 理念 ， 对 RISC Kitt 
行 了 一 层 抽象 ， 核 的 细节 隐藏 在 更 低 的 层次 上 ， 并 且 在 ISA3 EPS CISC HLA 


Maurice V. Wilkes 
Maurice Wilkes 1913 年 生 于 英格兰 Staffordshire #8 4% Dudley, 1936 年 从 便桥 大 学 获 


得 博士 学 位 。 次 年 ， 学 校 成 立 了 计算 机 实验 室 ， 任 命 Wilkes 领导 建造 一 个 新 的 差分 分 析 
器 。 二 战 爆发 时 ， 他 离开 学 校 参 战 ，1945 年 返回 实验 室 。 
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1946 $ Wilkes i 2] 4 + 4k $ 3} EDVAC 的 初步 报告 ， 该 报告 描述 了 由 取 指 - 译 
码 -加 1- 执 行 周期 控制 的 存储 程序 计算 机 的 概念 。 他 立即 “认为 这 会 马上 变 成 一 件 真实 
的 事 ”， 并 投入 其 中 开始 构造 一 个 基于 冯 湛 依 杰 原理 的 计算 机 。 他 参加 了 八 月 在 宾 夕 法 
尼 亚 大 学 进行 的 一 系列 讲座 ， 遇 到 了 冯 “' 诺 依 曼 的 同事 Herman Goldstine、John Mauchly 
和 Presper Eckert。 和 返回 剑桥 后 ， 他 决定 设计 和 建造 电子 延迟 存储 自动 计算 机 (Electronic 
Delay Storage Automatic Computer，EDSAC ) 。 

1949 年 5 月 6 日 ， 世 界 上 第 一 台 站 ' 诺 依 曼 机 器 EDSAC 在 剑桥 实验 室 上 线 了 。 
‘Wilkes 在 手书 笔记 写 道 :“ 机 器 第 一 次 运行 ， 打 印 方块 表 (0 一 99 )， 程 序 运行 时 间 2 分 
35 秒 。 ”打印 方块 是 对 这 个 机 器 漂亮 的 第 一 次 展示 ,但 是 很 快 Wilkes 就 开始 要 求 更 多 任 
务 了 。 程 序 通过 在 纸 带 上 打 孔 输入 计算 机 。Wilkes 用 打 孔 带 编程 让 EDSAC 解决 空气 差 
分 方程 ，y" -ty = 0， 用 在 物理 中 对 光 的 反射 建 模 。 程 序 有 126 行 ， 第 一 次 编写 的 时 候 有 
20 个 错误 。 下 面 的 引言 说 的 就 是 他 奔波 在 纸 带 打 孔 机 和 EDSAC 机 房 之 间 。Wilkes、D.J. 
Wheeler 和 S. Gill 在 1951 年 出 版 了 第 一 本 编程 书籍 《 The Preparation of Programs for an 
Electronic Digital Computer 》( 为 电子 数字 计算 机 准备 程序 )。 

也 是 在 1951 年 ，Wilkes 发 表 了 一 篇 题 为 “The Best Way to Design an Automated 
Calculating Machine”( 设 计 自 动 计算 机 器 的 最 好 方式 ) 的 论文 ， 讲 述 他 称 为 微 程序 设计 的 
新 技术 。Wilkes 不 仅 发 明了 Mc2 抽象 层 ， 还 构建 了 第 一 台 带 有 微 程 序 设计 的 控制 区 的 计 
算 机 。EDSAC 2 在 1958 年 早 些 时 候 投入 使 用 。Mec2 层 是 实际 上 所 有 商用 计算 机 的 标准 设 
计 ， 直 到 20 世纪 80 年 代 加 载 / 存储 体系 结构 变 得 流行 起 来 。 

EDSAC 2 的 另 一 项 设计 创新 是 它 的 位 片 组 织 结 
构 。EDSAC 机 器 是 用 真空 管 设 计 的 ， 因 为 当时 晶体 
管 还 没有 广泛 使 用 。 要 找到 和 替换 一 个 故障 的 真空 管 
很 困难 而 且 很 耗 时 。 图 11-40b 4 512X1 EA AH 
是 一 个 512 字 节 的 1 位 内 存 片 ， 按 照 与 此 类 似 的 方式 ，i 
EDSAC 2 的 数据 区 是 一 组 真空 管 的 窄 架 ， 每 一 个 架子 | 
是 整个 内 存 的 一 片 。 如 果 一 个 真空 管 损 坏 ， 可 以 用 一 E 
个 好 的 架子 替换 坏 的 ， 极 大 地 简化 了 维护 。 £ 

Wilkes 是 英国 计算 机 学 会 的 杰出 会 士 ， 皇 家 学 会 
的 会 士 和 皇家 工程 院 会 士 ， 并 于 1967 年 获得 ACM 图 
灵 奖 。Maurice V. Wilkes 于 2010 年 11 A 29 日 逝世 。 

“我 能 够 清楚 地 记得 那个 时 刻 ， 当 时 我 意识 到 从 此 以 后 我 
生命 中 很 大 一 部 分 时 间 就 要 花 在 给 自己 的 程序 查找 错误 上 了 。” 





Maurice V. Wilkes 





12.2.4 微 代码 


图 12-1 中 的 CPU 划分 为 数据 区 和 控制 区 。 给 定 一 个 实现 一 条 ISA3 指令 所 需 的 控制 信 
号 序列 ， 例 如 图 12-8 中 实现 STBYTEA 指令 的 序列 ， 问 题 是 该 如 何 设 计 控 制 区 来 产生 这 样 的 
信号 序列 呢 ? 

微 代码 背后 的 理念 是 控制 信号 的 序列 实际 上 是 一 个 程序 。 图 12-4 描述 的 是 汉 … 诺 依 曼 
周期 ,看 上 去 都 很 像 一 个 C++ 程序 。 设 计 控 制 区 的 一 种 方式 是 创建 Mc2， 即 微 代 码 抽象 层 ， 
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位 于 ISA3 和 LG1 之 间 。 像 所 有 抽象 层 一 样 ， 这 一 层 有 自己 的 语言 ， 包 括 一 组 微 编程 语句 。 
控制 区 是 一 个 单独 的 微机 器 ， 有 自己 的 微 内 存 uMem 和 自己 的 微 程序 计数 器 uPC， 以 及 自 
己 的 微 指 令 寄 存 器 uIR。 和 ISA3 层 机 器 不 同 ，Mc2 层 的 机 器 只 有 一 个 烧 和 人 uMem ROM 当 
中 的 程序 。 一 旦 芯片 制造 完成 ， 微 程序 就 不 可 以 改变 了 。 这 个 程序 包含 一 个 循环 ， 唯 一 的 目 
的 是 实现 ISA3 AS - 诺 依 曼 周 期 。 
图 12-22 给 出 Mc2 层 用 微 代 码 实现 的 Pep/8 的 控制 区 ， 图 中 没有 画 出 的 数据 区 在 它 的 左 
边 。 这 个 图 中 包含 的 数据 通路 是 对 图 12-2 的 修改 ， 以 支持 图 12-19 的 两 字 节 数据 总 线 。 从 
数据 区 到 控制 区 总 共有 12 条 数据 线 ，8 条 来 自 BBus，4 条 来 自 状态 位 。 总 共有 36 条 控制 线 
连 到 数据 区 。 
N— > 
Z 一 -一 > 


V 一 -一 > 12 
C 一 -一 > 


BBus 


LoadCk 








MemRead 36 


图 12-22 Pep/8 CPU 控制 区 的 微 代码 实现 


微 程序 计数 器 包含 下 一 条 要 执行 的 微 指令 的 地 址 。uPC 是 上 位 宽 ， 所 以 可 以 指向 uMem 
中 2: 条 指令 中 的 任意 一 条 。 微 指令 是 nn 位 宽 的 ， 所 以 uMem 中 每 个 单元 的 宽度 和 uIR 的 宽 
度 也 都 为 n。 在 Mc2 层 ， 没 有 理由 要 求 微 指令 的 宽度 必须 是 2 WE. n 可 以 是 你 想 要 的 任意 
奇怪 的 值 。 能 这 么 灵活 是 因为 uMem 只 包 
含 指令 不 包含 数据 ， 指 令 和 数据 没有 混合 |< 一 一 "36 一 一 >| 一 一 一 一 一 


— e SCE 
必须 适合 两 者 。 


图 12-23 给 出 了 微 指 令 的 指令 格式 。| 
最 右边 的 36 位 是 控制 信号 ， 要 发 送 到 数 图 12-23” 微 指令 的 指令 格式 
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据 区 ; 剩 下 的 字段 分 为 两 部 分 : Branch (4¢3¢) FEA Addr (地 址 ) 字段 。ISA3 层 的 程序 计 
数 器 每 次 加 1， 因 为 正常 的 控制 流 把 指令 顺序 存放 在 内 存 中 并 且 顺 序 执行 ， 所 以 唯一 的 变化 
是 由 于 分 支 指令 导致 的 PC 变化 。 但 是 在 Mc2 层 ，uPC 的 变化 不 是 加 1， 而 是 每 条 微 指令 包 
含 计 算 下 一 条 微 指 令 地 址 的 信息 。Branch 字段 指明 如 何 计算 下 一 条 微 指令 的 地 址 ，Addr 字 
段 包 含 用 于 计算 的 数据 。 

例如 ， 如 果 下 一 条 微 指令 不 依赖 于 来 目 数据 区 的 12 条 信和 号， 那么 Branch 字段 会 表明 
这 是 一 个 无 条 件 分 支 ，Addr 将 是 下 一 条 指令 的 地 址 。 实 际 上 ， 每 条 指令 都 是 一 条 分 支 指令 。 
要 按照 顺序 执行 一 组 微 指 令 ， 必 须 让 每 条 微 指令 无 条 件 分 支 转移 到 下 一 条 微 指令 。 图 12-22 
的 译 码 器 /分支 ( decoder/branch) 部 件 的 作用 是 ， 当 Branch 字段 表明 是 一 个 无 条 件 分 支 时 ， 
就 让 Addr 直接 通过 进入 uPC， 无 论 来 自 数据 区 的 12 条 线 的 值 是 什么 。 

BRLT 的 实现 。 这 个 例子 能 说 明 条 件 微分 支 指令 的 必要 性 ，BRLT 的 RTL 说 明 是 

N = 1 => PC © Opmd 

如 果 N 位 是 1， 则 PC 获得 操作 数 。 要 实现 BRLT， 微 指令 必须 检查 NN 位 的 值 ， 要 么 
什么 都 不 做 ， 要 人 么 分 支 跳 转 到 男 一 组 微 指 令 序 列 ， 用 操作 数 蔡 代 PC。 这 条 微 指令 包含 的 
Branch 字段 会 指明 下 一 个 地 址 是 用 N 和 Addr 一 起 计算 得 出 的 。 如 果 KN 为 0， 计算 会 产生 一 
个 地 址 ; 如 果 N 为 1， 会 产生 另 一 个 地 址 。 

通常 来 说 ， 条 件 微 分 支 需 要 根据 Addr 和 判断 条 件 依赖 的 、 来 自 数 据 区 的 信号 计算 出 下 
一 条 微 指 令 的 地 址 。 最 大 的 条 件 分 支 是 决定 要 执行 哪 条 ISA3 指令 的 分 文 ， 换 句 话 说， 就 是 
1h: 诺 依 曼 周 期 的 译 码 部 分 。 对 ISA 指令 译 码 的 微 指令 的 B 字 上段 为 8， 这 会 把 IR 的 第 一 个 
字 节 放 到 BBus. (IR 的 寄存 器 地 址 参见 图 12-2。) Branch 字段 会 说 明 是 指令 译 码 ， 译 码 髓 / 
分 支 单 元 会 输出 实现 该 指令 的 微 指令 序列 中 第 一 条 的 地 址 。 

微 指令 中 Branch 和 Addr 字段 的 细节 ， 以 及 译 人 码 絮 /分支 单 元 的 实现 不 在 本 书 讨论 范围 
之 内 。 虽 然 图 12-22 和 图 12-23 省 略 了 微 代 码 层 设计 中 很 多 实际 问题 ， 但 还 是 能 说 明 Mc2 层 
的 基本 设计 元 素 。 


12.3 MIPS L$ 


Pep/8 是 累加 器 机 器 的 示例 ， 因 为 计算 总 是 发 生 在 位 于 内 存 的 操作 数 和 累加 器 或 变 址 
寄存 器 之 间 。 例 如 ， 加 法 执行 ADDA， 它 把 操作 数 加 到 累加 器 ， 并 把 结果 存储 在 累加 器 中 。 


Peop/8 也 有 一 组 丰富 的 寻 址 方式 ， 能 够 用 较 少 的 指令 把 C++ 程序 翻译 为 Pep/8 汇编 语言 。 


12.3.1 FA /存储 体系 结构 


与 累加 器 机 器 对 比 的 是 装 人 /存储 (1load/store) 机 器 ， 它 简化 图 12-21 中 的 第 二 个 因 
子 以 降低 程序 的 执行 时 间 。MIPS 机 器 是 商用 制造 的 装 和 人 /存储 机 需 的 经 典 例子 ， 它 是 一 个 
32 位 机 器 ，CPU 中 有 32 个 32 位 寄存 器 。 图 12-24 按 比 例 画 出 了 MIPS CPU 中 的 寄存 器 和 
Pep/8 中 的 寄存 占 。 

每 个 寄存 器 都 有 一 个 特殊 的 汇编 命名 ， 以 $ 符 号 开头 。$0 是 一 个 常数 0 寄存 器 ， 类 
似 于 图 12-2 中 的 寄存 器 22， 不 过 它 在 ISA3 层 是 可 见 的 。$v0 Al $vl 用 于 子 例 程 返回 值 ， 
$a0 ~ $a3 用 于 子 例 程 的 参数 ， 类 似 于 6.5 节 中 操作 符 new 的 调用 协议 。 以 $t 开头 的 寄存 需 
是 临时 的 ， 在 函数 调用 之 间 不 会 保留 ， 而 以 $a 开头 的 寄存 器 会 保存 起 来 ， 在 函数 调用 之 间 
得 以 保留 。$k 寄存 器 预 留 给 操作 系统 内 核 ，$gp 是 全 局 指针 ，$sp ERIE, Sfp 是 帧 指针 ， 
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而 $ra 是 返回 地 址 。 





a) MIPS 寄 存 器 


|<—— 16 —>| 


b) Pep/8 AFTAN 
图 12-24 MIPS 和 Pep/8 CPU 寄存 器 比较 


和 大 多 数 微 处 理 器 相 比 ，Pep/8 是 很 小 的 机 器 。 图 12-24 表明 MIPS CPU 寄存 器 的 总 位 
数 是 Pep/8 CPU 寄存 器 的 16 倍 ， 这 还 不 算 MIPS 拥有 的 另 一 组 浮 点 寄存 器 ， 而 Pep/8 没有 
浮 点 寄存 器 。 即 使 数量 上 有 这 么 大 的 差距 ， 从 两 个 方面 来 说 MIPS 还 是 比 Pep/8 更 简单 : 它 
有 更 少 的 寻 址 方式 ， 以 及 它 的 指令 长 度 都 是 一 样 的 。 

图 12-4 给 出 的 是 Pep/8 WHS: 诺 依 曼 周 期 。 因 为 存在 有 两 种 指令 ， 所 以 这 个 周期 比 
较 复 条 。 这 两 种 指令 分 别 是 一 元 指令 和 三 字 节 非 一 元 指令 。RISC 体系 架构 的 一 个 目标 是 
尽量 简化 ， 直 到 每 条 指令 能 在 一 个 周期 内 执行 完 。 这 个 目标 表明 每 条 指令 有 相同 的 长 度 ， 
Æ MIPS 机 器 里 是 4 个 字 节 。 为 了 提高 性 能 ， 内 存 对 齐 问 题 要 求 每 条 指令 的 第 一 个 字 节 
必须 存储 在 能 被 4 整除 的 地 址 处 。 对 应 于 图 12-14b 内 存 芯 片 的 地 址 线 A2 ~ A31 和 数据 线 
D0 一 D31。 没 有 地 址 线 AO 和 A1， 因 为 每 次 取 数 一 次 会 取出 4 字 节 ， 所 以 一 次 访 存 就 能 取 
出 整 条 指令 。 图 12-25 展示 了 MIPS 机 器 的 冯 “' 诺 依 曼 周 期 。 没 有 if 语句 来 确定 指令 的 大 小 。 

图 12-25 中 MIPS WG - 诺 依 曼 周 期 是 一 个 无 限 循环 ， 这 比 Pep/8 的 循环 更 实际 。 实 际 
机 器 没有 STO 指令 ， 因 为 当 一 个 应 用 程序 





结束 后 操作 系统 会 继续 执行 。 eee 
相 比 Pep/8 的 八 种 寻 址 模式 ，MIPS 只 eee 

有 五 种 寻 址 模式 ， 如 图 12-26 所 示 。Pep/8 ”执行 取出 的 指令 

的 操作 数 指示 符 总 是 16 位 ， 但 是 MIPS 的 a 


操作 数 指示 符 大 小 取决 于 寻 址 方式 。MIPS 图 12-25 MIPS 汉 - 诺 依 曼 执行 周期 的 伪 代 码 描述 
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指令 总 是 包括 指令 指示 符 和 一 个 或 多 个 操作 数 指示 符 。 因 为 一 条 指令 必须 总 是 正好 4 
节 ， 所 以 指令 指示 符 和 操作 数 指示 符 必 须 能 装 进 32 位 中 ， 因 此 任意 操作 数 指示 符 必 须 小 于 
32 位 。 


TEE ~ apeu 



















NM | i as 
Mem [Reg [OpmdSpes 1 [Opas pee 2 





Mem [(PC + 4) + OprndSpec * 4] 
Mem [(PC + 4) <0..3> : OprndSpec * 4] 


图 12-26 MIPS 寻 址 方式 


立即 数 寻 址 、 寄 存 器 寻 址 和 基 址 寻 址 方式 用 于 访问 数据 ， 其 中 只 有 基 址 寻 址 访问 主 
存 。 图 12-26 中 的 记号 Reg 代表 寄存 器 (register)， 类 似 于 Mem 表示 内 存 (memory). A 
为 图 12-24a 的 寄存 器 体 中 有 32 个 寄存 器 ，2” 等 于 32， 所 以 要 访问 这 些 寄存 器 就 需要 5 位 。 
Reg[OprndSpec] 表示 操作 数 指示 符 指定 的 地 址 处 寄存 器 的 内 容 。 

PC 相对 寻 址 和 伪 直 接 (pseudodirect) 寻 址 方式 用 于 访问 指令 ， 没 有 直接 寻 址 方式 。 取 
指 时 ， 总 是 从 相对 于 程序 计数 器 的 位 置 取 。PC 相对 寻 址 方式 中 ，16 位 操作 数 指示 符 会 先 乘 
以 4 (因为 每 条 指令 占 4 个 字 节 )， 然后 再 加 上 加 1 之 后 的 程序 计数 器 。 加 法 的 结果 是 操作 数 
在 内 存 中 的 地 址 。 伪 直接 寻 址 方式 中 ， 冒 号 表示 连接 ， 连 接 的 左边 是 加 1 之 后 的 程序 计数 器 
的 前 4 位 (高 位 )， 连 接 的 右边 是 26 位 操作 数 指示 符 乘 以 4， 也 就 是 左 移 2 次， 得 到 一 个 28 
位 数字 。 连 接 得 到 的 结果 是 32 位 地 址 。 条 件 分 支 指令 使 用 PC 相对 寻 址 ， 而 无 条 件 跳 转 指 
令 使 用 伪 直 接 寻 址 。 


12.3.2 ”指令 集 


图 12-27 是 一 些 MIPS 指令 的 总 结 。 虽 然 有 些 指 令 用 了 额外 的 字段 进一步 指明 该 指令 的 
行为 ， 但 是 所 有 指令 都 有 一 个 6 位 操作 码 。 标 记 为 sssss 和 ttttt 的 操作 数 指示 符 是 5 位 
的 源 寄存 右 字 段 ， 标 记 为 ddddd 的 为 5 位 目标 寄存 器 字段 ， 而 标记 为 bbbbb 的 是 5 位 基 址 
寄存 器 字段 。 内 容 为 1 字符 的 字段 是 立即 数 操作 数 指示 符 ， 对 加 法 ， 立 即 数 做 符号 扩展 ， 对 
AND 和 OR， 立即 数 做 零 扩 展 。 内 容 为 a 字符 的 字段 是 地 址 操作 数 指 示 符 ， 在 地 址 计算 中 
做 符号 扩展 作为 偏 移 量 。 标 记 为 hhhhh 的 操作 数 指示 符 是 移 位 指令 的 5 位 位 移 量 。 

本 节 中 使 用 的 术语 和 表示 法 与 官方 MIPS 文档 有 些 不 同 。 一 些 术 语 做 了 修改 ， 以 和 
Pep/8 的 描述 相 一 致 。 例 如 ，Pep/8 对 位 的 编号 是 从 左 到 右 的 ， 而 MIPS 的 惯例 是 从 右 到 左 。 
ABP, Hid 总 是 表示 目标 寄存 器 ， 字 母 b 总 是 表示 基 址 寄存 器 ， 而 在 MIPS 文档 中 ， 字 
母 t 有 时 会 表示 目标 寄存 器 。 

图 12-28 比较 了 MIPS 和 Pep/8 加 法 指令 的 机 器 语言 格式 。MIPS 加 法 指令 不 访问 内 存 
中 的 操作 数 ， 相 反 ， 它 把 两 个 寄存 器 的 内 容 相 加 ， 把 和 放 到 第 三 个 寄存 器 中 。 图 12-28a 中 ， 
rs 和 rt 是 两 个 源 寄 存 器 ， 而 rd 是 存放 和 的 目标 寄存 器 。 名 为 shamt 的 字段 是 位 移 量 ， 用 在 
移 位 指令 中 ， 不 适用 于 加 法 指令 。 名 为 jnct 的 字段 是 功能 字段 ， 和 操作 码 字 段 联合 起 来 指 
明 操作 。 寻 址 方式 叫 作 寄存 器 寻 址 ， 原 因 很 明显 。 
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二 进 制 指令 编码 
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图 12-27 MIPS 指令 集 的 一 些 指令 


















加 法 指令 的 RTL 说 明 是 上 


moar iw [+ [+ | = [aml me 
对 应 的 MIPS 汇编 语言 语句 是 








add rd,rs,rt a) MIPS 寄 存 器 寻 址 
汇编 语言 中 操作 数 的 顺序 和 机 器 语言 中 的 Bee 
“ra 站 全 EEC 
装 人 /存储 机 上 需 的 一 个 关键 原理 是 所 ra PS 16 一 -一 一 | 
有 计算 都 是 对 寄存 器 中 的 值 进行 的 ， 一 b) Pep/8 通 用 寻 址 


条 指令 不 可 以 把 一 个 来 自 内 存 的 值 加 到 图 12-28 MIPS 和 Pep/8 加 法 指令 格式 比较 
来 自 寄存 器 的 值 上 。 必 须 首先 把 内 存 中 的 
值 装 人 另 一 个 寄存 器 ， 然 后 再 把 两 个 寄存 器 相 加 。 能 够 访 存 的 指令 只 能 是 装 人 和 存储 指令 。 
MIPS 机 器 中 ， 内 存 是 按 字 节 寻 址 的 ， 字 长 为 32 位 ， 字 数据 按 能 被 4 整除 的 内 存 地 址 对 齐 。 
两 条 用 于 访 存 的 指令 是 : 

e 1w 用 于 疾 入 字 

e sw 用 于 存储 字 

图 12-29 展示 了 1w 指令 的 MIPS 指令 格式 ，rb 是 基 址 寄存 器 ， 而 rd RAM Aa. 
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ATES A RTL 说 明 是 
rd — Memlrb + address] 


而 对 应 的 MIPS 汇编 语言 语句 是 |<— 6—>|<— 5 > |<— sma 


Ba T UR ay FF ae rt (NS TA ar ae 


[e—a | 
rd 外 ， 存 储 指令 的 指令 格式 与 图 12-29 中 
的 一 样 ， 参 见 图 12-27。 存 储 指令 的 RTL 图 12-29 采用 基 址 寻 址 的 加 载 指令 的 MIPS 指令 格式 
说 明 是 
Mem[rb + address] < rt 
对 应 的 MIPS 汇编 语言 语句 是 


sw rt,address(rb) 


标号 为 address 的 字段 不 是 绝对 地 址 ， 而 是 一 个 地 址 偏 移 量 (offset)， 要 把 它 加 到 rb LA 
能 得 到 绝对 地 址 。rb 寄存 器 32 位 宽 ， 但 是 地 址 字段 只 有 16 位 宽 。CPU 把 地 址 解释 为 有 
竺 号 整数 ， 这 样 一 来 ， 装 人 指令 可 以 从 寄存 器 rs 中 的 地 址 装 入 范围 +2” 或 32 768 字 节 内 
NF. 

Pep/8 寻 址 方式 中 最 类 似 于 MIPS 装 人 和 存储 指令 的 寻 址 方式 是 变 址 寻 址 ， 其 中 的 操作 
数 是 

Oprnd = Mem[OprndSpec + X] 


最 大 的 区 别 在 于 寄存 器 的 使 用 。Pep/8 中 ， 寄 存 器 X 包含 索 引 的 值 ， 而 MIPS 机 器 中 ， 寄 存 
ae tb 包含 数组 第 一 个 元 素 的 地 址 ， 即 数组 的 基 址 。 这 也 是 寄存 器 rb 称 作 基 址 寄存 器 的 原 
因 ， 这 种 寻 址 方式 称 作 基 址 寻 址 。 

在 像 Pep/8 这 样 的 累加 器 机 器 中 ， 变 量 的 当前 值 存 放 在 内 存 中 。 不 过 装 入 /存储 机 器 有 
大 量 寄存 髓 。 编 译 右 把 寄存 器 和 变量 关联 起 来 ， 在 寄存 器 中 完成 所 有 计算 。 在 四 种 情况 中 ， 
变量 的 值 必须 存储 到 内 存 中 。 第 一 ， 程 序 中 变量 数目 超出 了 可 用 的 寄存 器 数量 。 要 对 无 法 存 
放 在 CPU 中 的 变量 进行 计算 ， 就 要 把 寄存 器 中 现 有 的 值 “溢出 ”到 主 存 中 。 第 二 ， 在 做 递 
归 调 用 时 ， 必 须 把 局 部 变量 复制 到 内 存 中 的 运行 时 栈 。 第 三 ， 要 输出 一 个 值 ， 必 须 先 把 它 拷 
贝 到 内 存 。 第 四 ， 数 组 值 需要 的 存储 太 多 ， 无 法 装 和 寄存 器 中 。 不 过 编译 器 会 把 一 个 $s FF 
存 项 和 数组 变量 关联 起 来 ， 使 之 包含 数组 第 一 个 元 素 的 地 址 。 

例 12.1 假设 C++ 编译 硕 把 $sl 和 数组 a, $s2 和 变量 g9、$s3 和 数组 b 关联 起 来 ， 把 
下 面 的 语句 

aLI = g + bL3]; 
翻译 成 MIPS 汇编 语言 

lw $t0,12($s3) # Register $t0 gets b[3] 

add $t0,$s2,$tO # Register $t0 gets g + b[3] 

sw $t0,8($s1) # a[2] gets g + b[3] 
注释 以 “# ”符号 开始 。 装 人 指令 地 址 字段 为 12， 因 为 它 要 访问 b[3] ， 每 个 字 是 4 字 节 ， 
所 以 3x4 = 12。 类 似 地 ， 存 储 指令 的 地 址 字段 是 8， 因为 索引 值 在 ar[2]。 这 些 指令 的 机 器 
语言 翻译 是 
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100011 10011 01000 0000000000001100 

000000 10010 01000 01000 00000 100000 

101011 10001 01000 0000000000001000 
每 条 指令 的 前 6 位 是 操作 码 。 图 12-24 表明 $t0 是 寄存 器 8(dec) = 01000(bin), $s3 是 寄存 
器 19(dec) = 10011(bin), $s2 是 寄存 器 18(dec) = 10010(bin), mi $s1 是 寄存 器 17(dec) = 
10001(bin)。 i 口 

如 果 想 要 访问 一 个 下 标 为 变量 的 数组 元 素 ， 情 况 就 更 复杂 一 些 。 与 Pep/8 不 同 ，MIPS 
没有 变 址 寄存 器 。 所 以 ， 编 译 器 必须 生成 代码 ， 把 索引 值 加 到 数组 第 一 个 元 素 的 地 址 ， 获 得 
想 要 引用 元 素 的 地 址 。 在 Pep/8 中 ， 这 个 加 法 运算 是 在 Me 层 用 变 址 寻 址 自动 完成 的 。 但 
是 装 入 /存储 机 器 的 设计 哲学 是 拥有 较 少 的 寻 址 方式 ， 付 出 的 代价 是 程序 需要 更 多 语句 。 

在 Pep/8 中 ， 一 个 字 有 2 个 字 节 ， 所 以 索引 必须 左 移 一 次 ， 相 当 于 乘 以 2。 在 MIPS 中 ， 
一 个 字 是 4 个 字 节 ， 所 以 索引 要 左 移 两 次 ， 相 当 于 乘 以 4。MIPS 指令 s11 用 于 逻辑 左 移 ， 
用 图 12-28a 中 的 shamt 字段 指定 位 移 的 量 。 

例 12.2 把 $s0 的 内 容 左 移 7 位 并 把 结果 放 到 $t2 中 的 MIPS 汇编 语言 语句 是 

sill SO057 
机 器 语言 的 翻译 是 

000000 00000 10000 01010 00111 000000 
第 一 个 字段 是 操作 码 ; 这 条 指令 没有 使 用 第 二 个 字段 ， 因 此 都 被 设置 为 0 ; 第 三 个 字段 是 上 rt 
字段 ， 表 明 $s0， 寄 存 器 16(dec) = 10000 ; 第 四 个 是 rd 字段 ， 表 明 $t2, APA AE 10(dec) = 
01010(bin); 第 五 个 是 shamt 字段 ， 表 明 移 位 的 数量 ; 最 后 一 个 是 funct 字段 ， 和 操作 码 一 起 
表明 是 s11 指令 。 口 

例 12.3 假设 C++ 编译 器 把 $s0 和 变量 1、$sl 和 数组 a 以 及 $s2 和 变量 g 关联 起 来 ， 
把 下 面 的 语句 

日 = alii; 
翻译 成 MIPS 汇编 语言 如 下 


S11 $t0,$s0,2 # $t0 gets $s0 times 4 
add $t0,$s1,$tO # $t0 gets the address of a[i] 
lw $s2,0($t0) # $s2 gets a[i] 


注意 装 人 指令 的 地 址 字段 是 0。 口 

和 Pep/8 一 样 ，MIPS 机 器 有 直接 寻 址 |< “6 一 >|< 5 一 >|< 5 一 >|< 16 | 
方式 。 有 一 个 特殊 的 加 法 指令 ， 助 记 符 为 poe fom fo fm | 
addi ， 表 示 立 即 数 加 。 图 12-30 给 出 立即 
数 寻 址 的 指令 格式 ， 其 结构 跟 图 12-29 的 | 32 | 
FEE SHEA SRE, BRT 16 位 的 字段 是 12-30 采用 立即 数 寻 址 的 MIPS 指令 格式 
立即 数 操作 数 ， 而 不 是 地 址 偏 移 量 。 

例 12.4 在 运行 时 栈 上 分 配 4 字 节 存储 ， 要 执行 

addi $sp,$sp,-4 # $sp <- $sp - 4 
这 里 的 -4 不 是 地 址 ， 而 是 立即 数 。 机 器 语言 翻译 为 

001000 11101 11101 1111111111111100 


这 里 $sp 是 寄存 器 29。 
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你 可 能 已 经 注意 到 addi 指令 有 一 个 限制 。 常 数字 段 只 有 16 位 宽 ， 而 MIPS 是 32 位 机 
器 ， 使 用 立即 数 寻 址 应 该 能 加 一 个 32 位 的 立即 数 。 这 里 是 加 载 /存储 体系 结构 哲学 的 又 一 
个 示例 ， 其 主要 目标 就 是 寻 址 方式 较 少 的 简单 指令 。Pep/8 设计 允许 指令 宽度 不 同 ， 也 就 是 
一 元 指令 和 非 一 元 指令 宽度 可 以 不 同 。 图 12-4 展示 了 这 样 的 设计 决定 怎样 使 得 汉 ， KS 
周期 的 取 指 部 分 更 复杂 的 : 硬件 必须 取出 指令 指示 符 ， 对 它 译 码 以 决定 是 否 需 要 取 操 作 数 
指示 符 。 这 种 复杂 化 是 与 芍 人 /存储 哲学 相 违 背 的 ， 后 者 要 求 指令 简单 ， 能 够 很 快 地 译 码 出 
来 。 这 样 的 简化 目标 要 求 所 有 的 指令 长 度 相同 。 

但 是 ， 如 果 所 有 的 指令 都 是 32 位 宽 ， 那么 一 条 指令 又 怎么 可 能 包含 一 个 32 位 的 立即 
数 常 数 呢 ? 那样 指令 格式 中 就 没有 操作 码 的 地 方 了 。 这 里 利用 了 降低 图 12-21 中 的 第 二 个 因 
素 ， 代 价 是 增加 第 一 个 因素 。 解 决 32 位 立即 数 常数 的 方法 是 要 求 执行 两 条 指令 。 为 了 做 到 
这 点 ，MIPS 提供 了 1ui 指令 ， 意 思 是 装 人 立即 数 高 位 ， 它 把 一 个 寄存 器 的 高 16 位 设置 为 
它 的 立即 数 操作 数 ， 并 且 把 低位 设置 为 全 0。 第 二 条 指令 会 设置 低 16 位 ， 通常 是 使 用 或 立 
即 数 指令 ori。 

例 12.5 假设 编译 器 把 寄存 器 $s2 与 变量 g 关联 起 来 ， 把 C++ 语句 

g = 491521; 
翻译 成 MIPS 汇编 语言 

lui $s2,0x0007 

ori $s2,$s2,0x8001 
十 进 制 数 491 521 的 二 进 制 需 要 不 止 16 £2, 491 521(dec) = 0007 8001 (hex). 口 

MIPS 最 复杂 的 寻 址 方式 也 不 会 复杂 过 把 指令 的 一 个 地 址 字段 加 到 一 个 寄存 器 上 。 相 比 
之 下 ，Pep/8 最 复杂 的 寻 址 方式 是 栈 变 址 间接 寻 址 。 

Oprnd = Mem [Mem [SP + OprndSpec] + X] 

来 看 看 要 执行 一 条 栈 相对 间接 指令 CPU 必须 做 些 什么 。 首 先 ， 必 须 把 SP 加 上 OprndSpec. 
其 次 ， 必 须 从 那个 地 址 进行 一 次 内 存 取 。 然 后 ， 把 取出 的 数 加 到 X。 最 后 ， 从 那个 地 址 取出 
操作 数 。 这 很 复杂 ， 而 Pep/8 是 CISC。 

但 是 栈 相 对 间接 寻 址 的 目的 是 什么 呢 ? 6.4 节 表 明 访 问 作为 参数 传递 的 数组 需要 它 6.5 
PRHA new 操作 符 动态 分 配 的 结构 中 的 元 素 需 要 它 。MIPS 中 没有 栈 相 对 间接 寻 址 
就 意味 着 它 无 法 传递 数组 参数 吗 ? 当然 不 是 。 这 只 是 意味 着 编译 器 必须 生成 更 多 汇编 语言 语 
句 来 计算 操作 数 的 地 址 。 如 图 12-21 所 示 ， 程 序 包 含 大 量 简 单 的 语句 。 

RISC 的 论点 是 要 执行 更 多 指令 ， 但 是 每 条 指令 需要 更 少 的 周期 。 不 仅 如 此 ， 更 简单 的 
设计 可 以 从 集成 电路 中 获取 更 多 的 并 行 性 ， 所 以 最 终 效果 是 更 快 的 芯片 。 装 人 /存储 机 器 的 一 
个 特点 是 没有 微 代 码 抽象 层 。 这 种 机 器 的 控制 区 硬件 中 直接 有 一 组 有 限 状 态 机 ， 产 生 数 据 区 
的 控制 信号 。 一 般 来 说 增加 抽象 层 会 付出 性 能 的 代价 ， 而 消除 抽象 层 通常 会 获得 更 好 的 性 能 。 


12.3.3 ”高速 缓存 


Pep/8 控制 序列 要 求 内 存 读 和 写 需 要 2 个 周期 ， 因 为 通过 主 系统 总 线 访问 内 存 子 系统 要 
花费 额外 的 时 间 。 虽 然 这 个 要 求 使 得 模型 更 现实 ， 但 是 实际 上 主 存 访 问 时 间 和 CPU 周期 时 
间 之 间 速 度 的 不 匹配 要 更 严重 。 假 设 主 存 访问 需要 10 个 周期 而 不 是 2 个 周期 ， 想 象 一 下 控 
制 序列 看 上 去 会 像 什 么 样子 : 很 多 个 MemReads 周期 。 大 部 分 时 间 中 CPU 在 等 待 内 存 读 ， 
浪费 了 本 来 可 以 用 来 推进 作业 执行 的 周期 。 
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但 是 如 果 可 以 预测 未 来 呢 ? 如 果 提 前 知道 程序 需要 从 内 存 来 的 哪个 字 ， 那 么 可 以 设立 
一 个 更 贵 、 速 度 更 高 的 小 存储 器 ， 使 其 紧邻 着 CPU ， 称 为 高 速 缓存 〈cache)， 提 前 从 主 存 取 
出 指令 和 数据 ， 从 而 可 以 立即 为 数据 区 所 用 。 当 然 ， 没 有 人 能 预测 未 来 ， 所 以 这 种 机 制 是 不 
可 能 的 。 不 过 ， 即 使 不 能 100% 准确 地 预测 未 来 ， 如 果 能 达到 95% 的 准确 率 呢 ? 当 预 测 准 
确 时 ， 访 问 高 速 缓存 的 时 间 几 乎 是 立即 的 。 如 果 预 测 准 确 的 比率 足够 高 ， 加 速 比 就 会 很 客 
观 了 。 

问题 是 如 何 进 行 预测 。 假 设 能 够 监控 地 址 线 和 CPU 在 执行 典型 任务 时 的 所 有 内 存 请 求 ， 
那么 会 发 现 地 址 序列 是 完全 随机 的 吗 ? 也 就 是 给 定 一 个 地 址 请 求 后 ， 可 以 预期 下 一 个 请 求 与 
这 一 个 邻近 吗 ? 或 者 预期 它 与 这 个 请 求 的 距离 是 完全 随机 的 ? 

预期 连续 的 内 存 请 求 会 彼此 接近 是 基于 内 存 中 存储 的 两 样 东 西 ， 原 因 也 有 两 个 。 首 先 ， 
CPU 会 在 汉 : 诺 依 曼 周 期 的 取 指 部 分 访问 指令 ， 只 要 没有 分 文 指令 要 执行 距离 还 的 指令 ， 
CPU 就 会 请 求 聚集 在 一 起 的 指令 。 其 次 ，CPU 必须 访问 来 自 内 存 的 数据 。 不 过 第 6 章 中 的 
汇编 语言 程序 都 会 把 它们 的 数据 在 内 存 中 聚集 存放 。 应 用 程序 和 堆 存 放 在 内 存 低地 址 ， 操 作 
系统 和 运行 时 栈 存放 在 高 地 址 。 不 过 也 应 该 注意 到 ， 在 某 些 时 间 段 访问 会 集中 在 邻近 的 地 方 。 

内 存 访 问 并 不 是 随机 的 ， 这 个 现象 称 为 引用 局 部 性 (locality of reference)。 如 果 内 存 访 
问 是 完全 随机 的 ， 那 么 高 速 缓 存 就 完全 没有 用 ， 因 为 无 法 预测 要 从 内 存 读 哪些 字 节 ， 也 就 无 
从 预先 装 入 。 溯 运 的 是 典型 的 访问 会 展现 出 两 类 局 部 性 : 

e 空间 局 部 性 : 邻近 之 前 访问 过 的 地 址 很 有 可 能 在 临近 的 未 来 再 被 请 求 。 

o 时 间 局 部 性 : 之 前 访问 过 的 地 址 本 身 在 临近 的 未 来 很 有 可 能 再 被 请 求 。 

时 间 局 部 性 来 自 于 程序 中 经 常 使 用 的 循环 。 | 

4 CPU 请 求 来 自 于 内 存 的 加 载 时 ， 高 速 缓存 子 系统 首先 查看 所 请 求 的 数据 是 否 已 经 加 
载 进 高 速 缓存 ， 这 个 事件 称 为 高 速 缓存 命中 〈cache hit)， 如 果 是 这 样 ， 就 直接 传送 数据 。 如 
果 不 是 ， 则 发 生 高 速 缓存 不 命中 (cache miss) 事件 ， 需 从 主 存 取出 数据 ，CPU 必须 等 竺 更 长 
的 时 间 。 当 数据 最 终 到 达 时 ， 会 被 加 载 进 高 速 缓存 并 送 给 CPU。 因 为 数据 刚刚 被 请 求 过 ， 所 
以 有 很 高 的 概率 在 不 远 的 将 来 再 被 请 求 。 把 这 样 的 数据 保存 在 高 速 缓存 中 利用 了 时 间 局 部 性 。 
不 仅 把 所 请 求 的 数据 放 进 高 速 缓存 ， 还 把 所 请 求 的 字 节 附近 的 一 些 字 节 也 装 入 其 中 ， 这 利用 
了 空间 局 部 性 。 虽 然 带 和 人 了 一 些 没 有 被 请 求 的 字 方 ， 但 这 是 基于 对 未 来 的 预测 进行 的 提前 并 
载 。 在 不 远 的 将 来 访问 它们 的 概率 很 高 ， 因 为 它们 的 地 址 与 前 面 访问 过 字 节 的 地 址 距离 很 近 。 

为 什么 不 用 像 高 速 缓存 这 样 的 高 速 电路 构建 主 存 ， 把 它 放 在 高 速 缓存 的 位 置 ， 也 就 不 需 
要 高 速 缓存 了 ? 这 是 因为 高 速 内 存 电路 需要 在 芯片 上 占用 太 多 面积 。 最 快 和 最 慢 的 内 存 技术 
之 间 有 巨大 的 大 小 和 速度 的 差别 ， 这 是 经 典 的 空间 /时间 折 中 。 每 个 存储 单元 的 空间 越 大 ， 
内 存 操作 的 速度 就 越 快 。 

内 存 技术 在 这 两 种 极端 之 间 提 供 了 多 种 设计 ， 其 中 在 CPU 和 主 存 子 系统 之 间 使 用 三 层 
高 速 绥 存 是 最 典型 的 情况 : 

e 在 CPU 忌 片 上 把 L1 指令 和 数据 高 速 缓存 分 开 。 

o 在 CPU 封装 中 使 用 统一 的 L2 高 速 缓存 。 

o 在 处 理 器 主板 上 使 用 统一 的 L3 高 速 缓存 。 

图 12-31 给 出 了 这 样 的 三 层 结构 。 图 中 ， 封 装 是 一 个 自 包 含 的 电子 部 件 ， 可 以 单独 购买 


并 安装 在 电路 主板 上 。 计 算 机 制造 商 通常 会 设计 电路 主板 ， 购 严 封 装 ， 然 后 把 它们 安 猴 到 主 


板 上 ， 把 主板 放 进 机 箱 ， 再 把 机 箱 当 作 一 台 计 算 机 出 售 。L1 高 速 缓存 比 L2 高 速 缓存 更 小 更 
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快 ，L2 高 速 缓存 又 比 .L3 高 速 缓存 更 小 更 快 ， 而 L3 又 比 主 存 子 系统 更 小 更 快 。L1 高 速 缓存 
收 到 来 自 CPU 的 内 存 请 求 ， 如 果 缓 存 不 命中 ， 再 把 请 求 传递 到 L2 缓存 ， 如 果 L2 缓存 不 命 
中 ， 就 再 传递 到 L3， 如 果 L3 不 命中 ， 就 传递 到 主 存 子 系统 。 


Ab FH ae A 


高 速 缓存 必 片 





图 12-31 一 个 典型 计算 机 系统 中 的 三 层 高 速 缓 存 结构 


Ll 高 速 缓存 位 于 CPU 集成 电路 中 ,分 为 指令 高 速 缓存 和 数据 高 速 缓存 。CPU 会 区 分 
冯 ， 诺 依 曼 周 期 的 取 指 令 和 取 操 作 数 的 取 数 据 。L2 和 L3 高 速 缓存 也 称 为 统一 高 速 缓存 ， 因 
为 它们 对 指令 和 数据 不 做 区 分 ， 混 合 存储 。L1 高 速 缓存 的 典型 大 小 是 32KB 或 64KB。 (说 
明 一 下 Pep/8 有 多 小 ， 它 的 整个 内 存 正 好 能 装 进 一 个 典型 的 LI1 高速 缓存 中 。) LI 高 速 缓存 必 
须 按 照 CPU 的 速度 工作 ，L2 高 速 缓存 的 速度 通常 是 Ll 的 1/2 或 114， 时 间 是 后 者 的 2 一 4 
倍 。L3 通常 又 比 L2 慢 和 大 了 4 倍 。 随 着 主 系统 总 线 技术 的 发 展 ， 一 些 设 计 会 省 略 L3 高 速 
缓存 ， 因 为 L2 和 主 存 之 间 没 有 足够 大 的 速度 差 ， 不 需要 再 多 增加 一 层 。 

有 两 种 高 速 缓存 设计 方法 : 

e 直接 映射 高 速 缓存 。 

e 组 相 联 高 速 缓存 。 

两 者 中 比较 简单 的 是 直接 映射 高 速 缓存 ， 图 12-32 是 一 个 例子 。 和 前 面 的 例子 一 样 ， 这 个 例 
子 不 切实 际 地 小 以 帮助 进行 描述 。 

这 个 例子 是 一 个 具有 16 条 地 址 线 和 25 = 64KB 主 存 的 系统 。 内 存 被 划分 成 16 字 节 的 
块 ， 称 为 高 速 缓存 行 。 当 发 生 高 速 缓存 不 命中 时 ， 系 统 不 仅 会 加 载 所 请 求 的 字 节 ， 还 会 加 载 
包含 这 个 被 请 求 的 字 节 所 在 行 的 所 有 16 个 字 节 。 高 速 缓存 是 一 个 有 8 个 单元 的 小 型 存储 器 ， 
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地 址 从 0 一 7。 每 个 单元 分 为 三 个 字段 : ARAL (Valid), HE (Tag) 和 数据 (Data). WHE 
字段 是 高 速 缓存 单元 的 一 部 分 ， 存 放 来 自 内 存 的 高 速 缓存 行 的 副本 。 有 效 位 字段 是 一 位 ， 如 
困 高 速 缓存 单元 包含 有 效 的 来 自 内 存 的 珊 迷 绥 存 行 ， 那么 该 位 为 1， 否 则 为 0。 

地 址 字段 分 为 三 个 部 分 : 标签 (Tag)、 行 (Line) 和 字 节 ( Byte)。 字 节 字 段 是 4 位 ， 对 
应 于 24 = 16， 所 以 高 速 缓存 的 每 一 行 有 16 个 字 节 。 行 字段 是 3 位 ， 对 应 于 23 = 二 8， 所 以 高 
速 缓存 中 有 8 个 单元 。 标 签字 段 包 含 16 位 地 址 剩 下 的 位 ， 所 以 它 有 16-3-4 = 9 位。 高 速 
缓存 单元 包含 来 自 地 址 的 标签 字段 和 来 自 内 存 的 数据 。 在 这 个 例子 中 ， 每 个 高 速 缓存 单元 占 
用 一 共 1+9+128 = 138 位 。 因 为 高 速 缓存 中 有 8 个 单元 ， 所 以 总 共有 138X8 = 1104 fiz. 

当 系 统 启动 后 ， 会 把 高 速 缓 存 中 的 所 有 有 效 位 设置 为 0。 第 一 次 内 存 请 求 将 不 命中 。 来 
自 内 存 的 高 速 缓存 行 的 地 址 被 加 载 进 地 址 标签 字段 ， 最 后 4 位 被 设置 为 0; 从 内 存 取 出 该 行 ， 
并 存在 高 速 缓存 单元 中 ,设置 有 效 位 为 1; 还 会 从 地 址 中 提取 出 标签 字段 并 存储 。 
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图 12-32 ”直接 映射 高 速 缓存 


如 果 另 一 个 请 求 要 求 同 一 行 中 的 字 节 则 会 命中 。 系 统 从 该 地 址 提取 出 行 字 段 ， 到 高 速 组 
存 中 的 该 行 ， 确 定 有 效 位 为 1， 请求 的 标签 字段 与 高 速 缓 存单 元 的 标签 一 致 。 系 统 从 高 速 组 
存单 元 的 数据 部 分 取出 该 字 节 或 者 字 ， 并 送 到 CPU ， 不 需要 读 内 存 。 如 果 有 效 位 为 1， 但 是 
标签 字段 不 匹配 ， 就 是 不 命中 ， 需 要 进行 内 存 访 问 ， 新 的 标签 和 数据 字段 蔡 代 同一 高 速 缓存 
单元 中 旧 的 标签 和 数据 字段 。 

例 12.6 CPU 请 求 地 址 3519 (dec) WFT, 标签 字段 的 9 位 是 什么 ? 字 节 字段 的 4 位 
是 什么 ? 数据 会 存放 在 高 速 缓存 的 哪个 单元 ? 转换 为 二 进 制 并 抽取 出 相应 的 字段 得 到 
3519 (dec) = 000011011 011 1111 (bin) 
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标签 字段 的 9 位 是 000011011， 字 节 字 段 的 4 位 是 1111， 而 数据 存储 在 高 速 缓存 中 的 地 址 是 
011 (bin) = 3 (dec). . 口 

图 12-32 给 出 内 存在 地 址 16, 144, 272, … 的 块 ， 它 们 都 在 竞争 高 速 缓存 中 的 同一 个 位 置 ， 
即 地 址 为 1 的 条 目 。 由 于 标签 字段 有 9 位 ， 因 此 高 速 缓存 中 每 个 条 目 在 内 存 中 都 有 2’ = 512 
块 竞争 ， 而 每 个 条 目 每 次 只 能 放下 一 块 。 有 一 种 请 求 模式 会 导致 很 低 的 命中 率 ， 这 个 模式 是 
在 内 存 中 两 个 固定 的 区 域 之 间 来 回访 问 。 一 个 例子 是 一 个 程序 有 几 个 指针 ， 指 向 Pep/8 AF 
高 地 址 的 运行 时 栈 和 内 存 低地 址 的 堆 。 访 问 指针 和 它们 指向 的 单元 的 程序 就 会 具有 上 述 访问 
模式 。 如 果 指 针 和 它们 指向 的 单元 的 地 址 有 同样 的 行 字段 ， 命 中 率 就 会 急剧 降低 。 


组 相 联 高 速 缓存 用 于 减轻 这 个 问题 。 并 不 是 每 个 高 速 缓存 条 目 都 只 能 存放 来 目 内 存 的 一 


个 高 速 缓存 行 ， 而 是 可 以 存放 多 个 行 。 图 12-33a 描述 的 是 一 个 四 路 组 相 联 高 速 缓存 ， 
把 图 12-32 中 的 高 速 缓 存 复制 了 四 次 ,允许 一 组 最 多 四 个 具有 相同 行 字段 的 内 存 块 同时 存放 
在 高 速 缓存 中 。 这 个 访问 电路 比 直接 映射 高 速 缓存 的 电路 更 复杂 。 对 于 每 个 读 请 求 ， 便 件 必 
须 并 行 地 检查 高 速 缓存 单元 的 四 个 部 分 ， 如 果 有 的 话 ， 就 返回 行 字 段 匹配 的 那 一 个 。 
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图 12-33b 给 出 了 读 电 路 的 细节 。 有 等 号 的 圆圈 是 比较 器 ， 如 果 输 入 相等 ， 就 输出 1， 否 则 
输出 0。 这 里 的 128 复 用 器 比 通常 的 简单 。 四 输入 复 用 器 通常 有 两 个 选择 线 需要 译 码 ， 但 是 这 
个 复 用 器 的 四 条 选择 线 已 经 译 码 了 。 标 号 为 命中 的 输出 在 命中 时 为 1， 此 时 ， 标 号 为 数据 的 输出 
是 来 目 高 速 缓存 行 的 数据 ， 该 行 的 标签 字段 和 请 求 的 地 址 的 标签 字段 相同 。 否 则 ， 命 中 输出 为 0。 

使 用 组 相 联 高 速 缓存 的 另 一 个 麻烦 是 当 高 速 缓存 不 命中 发 生 时 ， 组 存单 元 的 四 个 部 分 都 
是 被 占用 的 ， 需 要 做 出 决定 。 问 题 是 ， 四 个 部 分 中 的 哪 一 个 该 被 来 自 内 存 的 新 数据 覆盖 呢 ? 
”一 项 技术 是 最 近 最 少 被 使 用 (LRU) 算法 。 在 一 个 两 路 组 相 联 高 速 缓存 中 ， 每 个 缓存 单元 只 
需要 再 增加 一 位 ， 就 可 记录 哪个 单元 最 近 最 少 被 使 用 。 但 是 在 一 个 四 路 组 相 联 高 速 缓存 中 ， 
要 记录 最 近 最 少 被 使 用 就 复杂 得 多 了 。 必 须 维护 按照 使 用 顺序 排列 的 四 个 条 目 列表 ， 而 且 每 
次 高 速 缓存 请 求 都 要 更 新 这 个 列表 。 四 路 高 速 缓存 的 一 种 近似 LRU 方法 是 使 用 三 位 ， 一 位 
表明 哪个 组 最 近 最 少 被 使 用 ， 每 个 组 内 的 位 表明 该 组 中 哪个 条 目 最 近 最 少 被 使 用 。 

无 论 高 速 缓存 是 直接 映射 还 是 组 相 联 ， 系 统 设 计 者 都 必须 决定 如 何 处 理 有 缓存 情况 下 的 
内 存 写 。 缓 存 命中 时 ， 有 两 种 可 能 性 : 

e 写 通 过 (write through): 每 个 写 请 求 会 更 新 高 速 缓存 和 相应 的 内 存 块 。 

e H] (write back): 写 请 求 只 更 新 高 速 绥 存 中 的 副本 。 对 内 存 的 写 只 有 在 该 缓存 行 被 

替换 时 才 发 生 。 

图 12-34 摘 述 了 这 两 种 可 能 性 。 写 通过 是 比较 简单 的 设计 ， 当 系统 要 写 内 存 时 ，CPU 会 
继续 处 理 。 当 高 速 缓存 行 需 要 被 替换 时 ， 内 存 中 的 值 保证 已 经 是 最 近 的 更 新 了 。 这 样 做 的 问 
题 是 ， 当 写 请 求 爆发 时 ， 总 线 上 的 流量 会 很 大 。 写 回 策略 降低 了 总 线 流量 ,否则 这 些 总 线 流 
量 可 能 会 影响 其 他 想 使 用 主 系统 总 线 的 部 件 的 性 能 。 不 过 在 任何 给 定 的 时 刻 ， 内 存 中 不 一 定 
具有 变量 当前 最 新 的 值 。 同 时 ， 当 要 替换 某 个 缓存 行 时 ， 会 有 一 定 的 延迟 ， 因 为 要 先 更 新 内 
存 ， 才 能 把 新 数据 加 载 进 高 速 缓存 。 通 过 设计 可 使 缓存 命中 率 很 高 ， 这 样 的 事件 不 会 经 常 发 生 。 

关于 高 速 缓存 另 一 个 要 解决 的 问题 是 当 缓 存 不 命中 时 ， 该 如 何 处 理 写 请 求 。 一 种 称 为 
写 分 配 的 策略 把 块 从 内 存 带 人 高 速 缓存 ， 可 能 会 替换 另 一 个 缓存 行 ， 然 后 按照 正常 的 缓存 写 
策略 更 新 这 一 行 。 若 不 采用 写 分 配 ， 就 会 绕 过 高 速 缓存 发 起 一 个 内 存 写 。 这 里 的 主要 思想 是 
CPU 可 以 继续 处 理 过 程 ， 内 存 写 可 以 并 发 地 完成 。 

图 12-35 给 出 的 是 使 用 和 不 使 用 写 分 配 的 高 速 缓 存 写 策略 。 虽 然 每 种 缓存 不 命中 时 的 写 
策略 可 以 和 任意 一 种 缓存 命中 时 的 写 策略 组 合 ,， 但 是 写 分 配 通常 和 缓存 命中 时 的 写 回 一 起 使 
用 ， 而 写 通 过 高 速 缓存 通常 不 使 用 写 分 配 ， 以 保持 设计 简单 。 图 12-34 与 图 12-35a 和 
图 12-35b 对 应 于 大 多 数 高 速 缓存 的 设计 选择 。 


每 次 写 每 次 写 
CPU Cache Mem CPU Cache Mem 


= SS] 
被 替换 时 被 蔡 换 时 
CPU Cache Mem 


|_| Epe CPU Cache Mem E S|) 4 
Hars THE] 加 


a) 写 通过 b) 写 回 a) 不 使 用 写 分 配 b) 使 用 写 分 配 
12-34 高速 缓 存 命中 时 的 写 策略 图 12-35 “高速 缓存 不 命中 时 的 写 策略 


[| 
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如 果 你 读 过 9.2 节 中 有 关 虚 拟 内 存 的 讨论 ， IBAA SERGE TIC DAT HK 
很 卫 熟 。 虚 拟 内 存 背 后 的 动机 也 是 一 样 的 ， 即 较 小 的 主 存 和 存储 在 硬盘 上 的 可 执行 程序 的 大 
小 之 间 的 不 匹配 ,而 高 速 缓存 背后 的 动机 是 较 小 的 高 速 缓存 和 主 存 大 小 之 间 的 不 匹配 。 虚 拟 
内 存 中 的 LRU 页 蔡 换 策略 对 应 于 高 速 绥 存 行 的 LRU 替换 策略 。 高 速 缓存 之 于 主 存 就 像 主 
存 之 于 人 磁盘。 在 这 两 种 情况 中 ， 都 有 一 个 路 越 两 层 的 内 存 层 次 结构 (memory hierarchy)， 包 
括 一 个 小 但 高 速 的 存储 子 系统 和 一 个 大 但 慢 度 的 存储 子 系统 。 两 个 层次 结构 中 设计 方案 都 依 
赖 于 引用 局 部 性 。 两 个 领域 中 的 设计 有 共同 的 问题 和 解决 方法 ， 这 不 是 巧合 。 这 些 原 理 是 普 
适 的 ， 另 一 个 证 明 是 软件 中 的 哈 而 表 数 据 结构 。 在 图 12-32 中 可 以 看 出 从 主 存 到 高 速 缓存 的 
映射 实际 上 是 一 个 哈 希 函数 。 组 相 联 高 速 缓存 甚至 看 上 去 就 很 像 哈 希 表 ， 它 通过 链表 解决 冲 
突 ， 只 不 过 链表 的 长 度 有 上 限 。 


12.3.4 MIPS 的 计算 机 组 成 


图 12-36 展示 的 是 MIPS CPU 的 数据 区 ， 它 的 基本 组 成 结构 和 图 12-2 的 Pep/8 的 数 
据 部 分 一 致 ，ABus Ñ BBus 送 到 主 ALU, ALU 的 输出 通过 CBnus 最 终 到 达 CPU 寄存 器 
体 。 组 成 中 最 大 的 不 同 是 通路 中 的 L1 指令 和 数据 高 速 缓存 。 因 为 大 多 数 高 速 缓存 的 命中 
ARTE 90% 之 上 ， 所 以 我 们 可 以 假设 内 存 读 和 写 以 CPU 全 速度 在 进行 ， 没有 MemRead 和 
MemWrite 延迟 ， 除 了 偶尔 发 生 缓存 不 命中 的 时 候 。 

和 Pep/8 不 同 ， 程 序 计 数 器 不 是 寄存 器 体 中 的 通用 寄存 需 之 一 。 图 中 标号 为 Plus4 的 方 
框 对 PC 加 4， 通 过 两 个 复 用 器 PCMax 和 JMux 送 回 PC。 因 为 所 有 指令 都 是 4 字 节 长 ， 所 
以 这 个 汉 ，… 诺 依 曼 周 期 的 地 址 增加 部 分 比 Pep/8 简单 ， 可 以 用 一 个 特殊 的 硬件 单元 实现 ， 不 
需要 跟 主 ALU 绑 在 一 起 或 占用 周期 。 分 文 指令 使 用 PC 相对 寻 址 ， 符 号 位 扩展 16 位 地 址 字 
段 加 上 增加 过 的 PC 得 到 分 支 地 址 。 图 12-36 Ex 部 分 中 的 ASL2 方 框 对 地 址 做 移 位 ， 因 为 指 
令 中 的 地 址 字段 不 存储 最 低 两 位 。 这 些 位 永远 为 0， 因为 地 址 要 求 在 内 存 中 四 字 节 对 齐 。 左 
移 2 位 对 应 于 图 12-26 中 的 乘 以 4。 

跳 转 指令 使 用 伪 直 接 寻 址 。 图 12-36 IF 部 分 中 的 ASL? 方块 将 地 址 左 移 2 位， 结果 和 增加 
过 的 PC 的 前 4 位 (高 4 位 ) 连接 。 这 是 用 特殊 目的 电路 硬件 实现 图 12-26 中 的 伪 直 接 寻 址 方式 。 

CPU 不 会 写 指令 高 速 缓存 ， 只 会 请 求 从 PC 指定 的 地 址 读 。 高 速 缓存 子 系统 在 命中 时 会 
从 缓存 中 送出 指令 ， 不 命中 时 会 延迟 CPU， 最 终 从 L2 高 速 缓存 读 到 指令 ， 写 人 LIl BRA 
存 ， 并 通知 CPU 可 以 继续 了 。 因 为 CPU 决 不 会 写 指令 缓存 ， 所 以 把 缓存 当 作 组 合 电 路 ， 这 
是 指令 缓存 没有 画 阴 影 的 原因 。 

标记 为 寄存 器 体 的 方块 是 一 个 双 端 口 32 位 寄存 器 体 ， 如 图 12-24a 所 示 。 标 记 为 译 码 指 
令 的 方块 是 一 个 组 合 电 路 ， 输 入 为 32 位 指令 ， 它 译 码 出 操作 码 ， 发 送 适 当 的 寄存 器 地 址 信 
号 到 A、B 和 C， 这 些 都 是 5 位 地 址 线 ， 对 图 12-24a 中 的 32 个 寄存 器 寻 址 。 译 码 方块 有 很 
多 连接 复 用 器 和 ALU 的 控制 线 ， 图 12-36 中 没有 给 出 。 

每 个 周期 PC 都 会 收 到 时 钟 信号 并 驱动 主 循环 。 寄 存 器 体 和 数据 高 速 缓存 并 不 总 是 接受 
时 钟 ， 这 取决 于 在 执行 的 指令 。 对 图 12-36 中 三 个 时 序 电 路 有 三 个 时 钟 : PC 的 PCCk， 寄 存 
器 体 的 LoadCk 和 L1 数据 高 速 缓存 的 DCCk。 

无 条 件 跳 转 和 有 条 件 分 支 指令 唯一 的 目的 是 改变 程序 计数 器 。 图 12-36 表明 PC 的 所 有 
计算 都 由 特殊 硬件 单元 完成 ，ASL2 把 PC 乘 4，Plus4 把 PC 加 4。 下 面 的 例子 假设 控制 线 
的 使 用 类 似 于 图 12-2 中 Pep/8 控制 线 的 使 用 ， 只 不 过 图 12-36 中 没有 给 出 。 
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L1 指 令 高 速 缓存 


ID 
指令 译 码 / 
寄存 器 文件 读 


Ex 
执行 /地 址 计算 


Mem 
内 存 访 问 


WB 
写 回 


图 12-36 MIPS 数据 区 。 时 序 电 路 用 阴影 表示 


例 12.7 跳 转 指令 使 用 伪 直 接 寻 址 。 假 设 Mux 控制 线 按照 惯例 ，0 选择 左边 的 输入 ，1 
选择 右边 的 输入 ， 那 么 跳 转 指令 需要 下 面 的 控制 信号 : 

1. JMux=0; PCCk 
在 周期 开始 执行 前 ，PC 是 跳 转 指令 的 地 址 ，26 位 地 址 字段 送 到 ASL2 的 输入 ， 增 加 过 的 PC 
的 前 4 位 和 ASL2 的 输出 连接 ， 送 到 JMux，JMux 的 输出 送 到 PC。 时 钟 脉 冲 到 达 时 会 更 
新 PC。 口 

例 12.8 条 件 分 支 指令 使 用 PC 相对 寻 址 ， 需 要 下 面 的 控制 信号 。 

1. PCMux=1, JMux=1; PCCk 
在 周期 开始 执行 前 ，PC 是 条 件 分 支 指令 的 地 址 ，16 位 地 址 字段 送 到 ASL2 的 输入 ，ASL2 
输出 和 增加 过 的 PC 送 到 特殊 目的 加 法 器 ， 加 法 器 的 输出 送 到 PCMux，PCMux 的 输出 送 到 
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JMux, Mi JMux 的 输出 送 到 PC。 时 钟 脉 冲 到 达 时 会 更 新 PC。 口 
数据 区 中 组 成 部 分 的 组 织 方式 有 助 于 存储 指令 。ABnus 提供 了 一 条 通路 ， 从 寄存 器 体 直 
接 到 L1 数据 高 速 缓存 的 数据 输入 。 此 外 ， 主 ALU 的 输出 连接 数据 缓存 的 地 址 线 。 因 此 ， 
存储 指令 的 地 址 计算 的 加 法 是 由 主 ALU 而 不 是 特殊 目的 硬件 单元 完成 的 。PC 更 新 和 数据 写 
回 数据 高 速 缓存 同时 进行 。 
例 12.9 字 存 储 指令 sw 的 RTL 说 明 为 


Mem [rb + address] < rt , 


因为 这 条 指令 要 更 新 PC 并 写 内 存 ， 所 以 这 个 周期 同时 需要 时 钟 脉冲 PCCK 和 DCCk。 控 抽 
信号 是 

1. PCMux=0, JMux=1, A=rt, AMux=1, Berb, ALU=A plus B; PCCk, DCCk 
PCMux=0 和 JMux=1 信号 把 增加 过 的 PC 送 到 PC。A=rt 信号 把 rt 源 寄存 器 的 内 容 送 到 
ABus， 作 为 要 送 到 高 速 缓存 的 数据 。AMux=1 信号 选择 把 指令 的 地 址 字段 作为 ALU 的 左 输 
A, B = rb 信号 把 基 址 寄存 器 送 到 BBus， 作 为 ALU 的 右 输入 。 选 择 加 法 功能 ， 地 址 计算 
的 结果 送 到 数据 高 速 缓存 的 地 址 线 。 口 

寄存 器 指令 用 主 ALU 完成 处 理 , 但 是 不 写 内 存 。 因 此 ，ALU 的 输出 有 一 条 通过 CMux 
到 寄存 器 体 的 通路 。 和 存储 指令 一 样 ，PC 和 寄存 器 体 的 更 新 是 同时 发 生 的 。 

例 12.10 ”加 法 指令 add 的 RTL 说 明 为 


rd<rs+rt 


因为 它 要 更 新 PC 和 写 寄存 右 体 ， 所 以 这 个 周期 同时 需要 时 钟 脉冲 PCCk 和 LoadCk。 控 制 
信号 是 

1. PCMux=1, JMux=1, A=rs, AMux=0, B=rt, ALU=A plus B, CMux=0, C=rd; 

PCCk, LoadCk 


PCMux=0 和 JMux=1 信号 把 增加 过 的 PC 3K 2) PC. A=rs 信号 把 rs 源 寄 存 器 的 内 容 放 到 

ABus, AMux=0 信号 会 把 它 当 作 数 据 通过 AMux 送 到 高 速 缓存 。B=rt 信和 号 把 基 址 寄存 器 

送 到 BBus， 作 为 ALU 的 右 输 入 。 选 择 加 法 功能 ， 用 CMux=1 信号 把 结果 通过 CMux 送 到 

CBus。 信 号 C=rd 对 寄存 器 体 寻 址 ， 地 址 为 目标 寄存 器 rd. 口 
装 人 指令 的 控制 信号 作为 章 末 练习 。 


12.3.5 流水线 


PC 在 周期 开始 时 变化 ， 数 据 必 须 按 照 下 列 顺序 通过 组 合 电路 : 
IF: 指令 高 速 缓存 ，Plus4 加 法 器 ， 移 位 器 和 复 用 器 。 

ID: 译 人 码 指令 方 框 ， 寄 存 器 体 ， 符 号 扩展 方 框 。 

Ex: AMux，ASL2 Mät, ALU, IMAR 

Mem: 数据 高 速 缓存 。 

WB: CMux， 寄 存 器 体 的 地 址 译 码 器 。 

CPU 设计 者 必须 把 时 钟 周期 设置 得 足够 长 ， 使 得 数据 (PC， 寄 存 器 体 和 数据 高 速 缓存 ) 
送 到 时 序 电 路 ， 然 后 时 钟 会 把 数据 写 人 时 序 电 路 。 图 12-37 给 出 了 几 条 指令 逐条 执行 的 时 间 
线 。 方 框 代表 每 个 阶段 的 传递 时 间 。 

图 12-37 中 的 情况 类 似 于 一 个 要 制造 家 具 的 工匠 ， 他 的 作坊 有 所 有 工具 来 做 三 件 事 : 切 
割 木 头 、 装 配 和 上 漆 。 因 为 只 有 一 位 工匠 ， 所 以 他 会 按照 这 样 的 顺序 来 制造 家 具 ， 然 后 一 件 
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图 12-37 不 使 用 流水 线 的 指令 执行 


一 件 地 做 。 如 果 再 有 两 位 工匠 ， 便 有 几 种 方法 来 增加 每 天 能 完成 的 家 具 数 量 。 其 他 工匠 如 果 
有 目 己 的 工具 ， 那 么 三 个 工匠 可 以 并 行 工作 ， 同 时 为 三 件 家 具 切 割 木 头 、 装 配 和 上 漆 。 单 位 
时 间 的 输出 确实 会 是 原来 的 三 倍 ， 但 是 额外 的 工具 也 是 一 笔 开 销 。 

一 种 更 经 济 的 蔡 代 方 法 是 确认 当 某 人 正在 用 螺丝 和 胶水 进行 装配 时 ， 切 割 木 头 的 工具 可 
以 用 于 制造 下 一 件 家 具 。 类 似 地 ， 当 第 一 件 家 具 上 漆 时 ， 第 二 件 在 组 装 中 ， 第 三 件 则 正在 切 
割 中 。 应 该 可 以 看 出 ， 这 种 组 织 结构 是 工厂 装配 线 的 基本 架构 。 

对 应 于 工具 的 资源 是 上 面 列 出 的 五 个 方面 的 组 合 电 路 : 取 指 ， 指 令 译 码 / APE RECIFE, 
执行 /地 址 计算 ， 访 存 和 写 回 。CPU 流水 线 的 理念 是 把 执行 一 条 指令 花费 的 周期 数 增加 为 原 
来 的 5 倍 ， 但 是 把 每 个 周期 的 时 间 降 低 为 原来 的 1/5。 初 看 上 去 这 样 做 没有 什么 好 处 ,但 是 
把 指令 和 指令 的 执行 重 倒 起来， 就 能 获得 并 行 性 ， 增 加 每 秒 执行 的 指令 数 。 

要 实现 这 个 想法 需要 对 图 12-36 的 数据 通路 做 一 些 修改 。 每 个 阶段 的 结果 必须 保存 ， 以 
作为 下 一 阶段 的 输入 。 在 这 五 个 部 分 之 间 的 边界 要 放 一 组 寄存 器 ， 如 图 12-38 所 示 。 在 每 个 新 
的 缩短 了 的 周期 结束 前 ， 每 条 要 送 到 下 个 阶段 的 数据 通路 的 数据 都 要 存放 在 边界 寄存 器 中 。 

只 有 当 每 个 阶段 的 传播 时 间 完 全 相等 时 ， 周 期 时 间 才 能 刚好 降低 为 原来 的 1/5。 实 际 上 
不 太 可 能 这 样 ， 所 以 新 周期 时 间 是 所 有 缩短 过 的 阶段 中 延 妈 最 长 的 阶段 的 传播 时 间 。 实 现 流 
水 线 要 选择 把 边界 寄存 器 放 在 哪里 ， 设 计 者 必须 设法 均匀 划分 这 些 阶 段 。 

图 12-39 展示 了 流水 线 是 如 何 工 作 的 。 启 动 时 流水 线 是 空 的 。 在 周期 1， 第 一 条 指令 
取 指 。 在 周期 2， 第 二 条 指令 取 指 ， 同 时 第 一 条 指令 译 码 和 读 寄 存 器 体 。 在 周期 3， 第 三 
条 指令 取 指 ， 同 时 第 二 条 指令 译 码 和 读 寄 存 器 体 ， 同 时 第 一 条 指令 执行 ， 以 此 类 推 。 这 样 做 
能 带 来 加 速 是 因为 这 使 得 更 多 电路 部 件 可 同时 使 用 。 流 水 线 就 是 一 种 形式 的 并 行 。 理 论 上 ， 
对 于 一 个 完美 的 有 五 个 阶段 的 流水 线 ， 当 流水 线 充满 时 ， 每 秒 执行 的 指令 数 能 提高 500%。 

这 是 好 消息 ， 不 过 也 有 坏 消 息 ， 有 些 问 题 会 破坏 这 个 看 上 去 很 美好 的 画面 。 这 样 的 问题 
分 为 两 类 ， 称 为 危害 (hazard): 

e 控制 危害 ,来 自 无 条 件 和 条 件 分 文 

e 数据 危害 ,来 目 指 令 间 的 数据 依赖 

这 两 种 危害 都 是 由 于 有 指令 不 能 在 流水 线 的 某 个 阶段 执行 完 任 务 ， 因 为 它 需 要 前 面 尚 未 
执行 完毕 的 指令 的 结果 。 人 危害 会 导致 这 条 指令 不 能 继续 ， 只 能 停顿 ， 这 在 流水 线 中 造成 了 一 
个 气泡 ， 必 须 将 其 清除 ， 然 后 才 可 能 达到 峰值 性 能 。 

图 12-40a 展示 的 是 没有 人 危害 时 流水 线 从 起 始 时 的 执行 。 第 一 行 第 二 组 五 个 方块 表示 要 
执行 的 第 6 条 指令 ， 第 二 行 的 第 一 组 表示 第 7 条 指令 ， 以 此 类 推 。 从 第 5 个 周期 开始 ， aT 
流水 线 就 开始 以 峰值 性 能 运行 了 。 

考虑 分 文 指令 执行 时 会 发 生 什 么 。 假 设 指令 7 是 一 条 分 支 指令 ， 它 从 周期 7 第 二 行 开 
始 。 假 设 更 新 过 的 程序 计数 器 要 到 这 条 指令 完成 时 才能 为 第 二 条 指令 所 用 ， 那 么 指令 8 及 其 
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后 面 的 指令 都 必须 停顿 。 图 12-40b 中 气泡 是 未 加 阴影 的 。 结 果 看 上 去 就 像 流 水 线 必须 在 周 
期 12 重新 开始 。 图 12-41 显示 分 支 指 令 占 到 MIPS 机 器 上 典型 程序 中 15% 的 执行 语句 。 所 一 
以 大 概 每 7 条 指令 就 要 延迟 四 个 周期 。 





L1 指 令 高 速 缓存 
地 址 


piles 
mt 


IF/ID 寄 存 器 


ID 
指令 译 码 / 
寄存 器 文件 读 


ID/Ex #5 4448 


Ex 
执行 /地 址 计算 


Ex/Mem 寄 存 器 
Mem 

访 存 
Mem/WB 寄 存 器 


WB 
写 回 





图 12-39 ”使 用 流水 线 时 的 指令 执行 
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b) 分 支 危害 


图 12-40 和 危害 对 流水 线 的 影响 


有 几 种 方法 可 降低 控制 危害 带 来 的 性 能 处 罚 。 图 12-40b 
假设 分 支 指令 的 结果 要 到 写 回 阶段 之 后 才能 得 到 ， 但 是 实际 
上 分 支 指令 不 改变 寄存 器 体 。 所 以 ， 假 设 下 一 条 指令 被 延迟 
了 ， 要 降低 气泡 的 长 度 ， 系 统 就 必须 消除 分 支 指令 的 写 回 阶段 。 
增加 额外 的 控制 硬件 会 把 气泡 的 长 度 从 四 个 周期 减少 到 三 个 。 图 12.41 MIPS 指令 的 执行 频率 

对 条 件 分 支 男 外 还 有 一 个 机 会 能 降低 危害 的 影响 。 假 设 
增加 额外 的 控制 硬件 ， 分 支 的 处 罚 是 3 个 周期 ， 而 计算 机 执行 下 面 这 个 MIPS 程序 ; 


beq $sl1,$s2,4 
add $s3,$s3,$s4 
sub $s5,$s5,$s6 
andi $s7,$s7,15 
$11 $s0,$s0,2 
ori $s3,$s3,1 


第 一 条 指令 是 如 果 相 等 分 支 ， 地 址 字段 是 4， 这 意味 着 这 个 分 支 是 到 下 一 条 指令 后 面 四 
个 的 那 条 指令 。 所 以 ， 如 果 选 择 了 该 分 支 ， 就 会 是 ori 指令 。 如 果 没 有 选择 分 支 ， 接 下 来 
会 执行 add。 

从 图 12-40b 中 可 以 看 到 浪费 了 很 多 并 行 性 。 随 着 气泡 被 冲洗 出 流水 线 ， 很 多 阶段 都 是 
空闲 的 。 在 等 待 beq 的 结果 时 ， 不 知道 是 否 该 执行 add、sub 和 andi。 不 过 还 是 可 以 假设 
不 会 选择 分 支 而 执行 它们 。 如 果实 际 上 没有 选择 分 支 ， 那 么 就 刚好 消除 了 气泡 ; 如 果 选 择 了 
分 支 ， 从 气泡 延 返 的 角度 来 说 ， 也 不 会 比 不 执行 beq 后 面 的 指令 更 差 ， 在 那 种 情况 下 ， 是 把 
气泡 冲 出 流水 线 。 

这 样 做 的 问题 是 需要 电路 清理 如 果 假 设 错 误 选 择 了 分 支 之 后 留 下 的 坏 影响 。 必 须 记 录 好 
中 间 的 所 有 指令 ， 在 发 现 分 支 是 否 跳 转 之 前 ， 不 允许 它们 永久 地 修改 数据 高 速 缓存 或 寄存 天 
体 。 当 发 现 不 选择 分 支 时 ， 就 可 以 提交 这 些 改 变 了 。 

假设 分 支 不 会 跳 转 是 一 种 原始 的 预测 未 来 的 方法 ， 这 就 好 像 去 看 赛马 时 总 是 把 赌注 压 
在 同一 匹 马 上 而 不 管 它 之 前 的 战绩 如 何 。 可 以 让 历史 指引 选择 ， 这 种 技术 称 为 动态 分 支 预测 
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(dynamic branch prediction ) 。 在 分 文 语句 执行 时 ， 同 时 记录 这 个 分 文 是 跳 转 还 是 不 跳 转 ， 如 

果 跳 转 ， 则 记录 它 的 目的 地 址 。 下 次 这 条 指令 执行 时 ， 就 预测 会 发 生 同 样 的 结果 。 如 果 上 一 

次 跳 转 了 ， 那 就 用 分 文 目 的 处 的 指令 填充 流水 线 ， 否 则 就 用 分 文 指令 后 面 的 指令 填充 流水 线 。 
上 述 方法 称 为 一 位 分 文 预 测 AAR 

需要 一 位 就 能 记录 某 个 分 支 是 跳 转 还 是 不 跳 转 


跳 转 。 一 位 存储 单元 定义 了 一 个 有 两 个 状 | LEAD — ea 
态 的 有 限 状 态 机 ， 两 个 状态 分 别 对 应 于 巴 


ne ‘ 不 跳 转 
测 分 支 是 否 会 跳 转 。 图 12-42 给 出 的 就 是 slg 
这 个 有 限 状态 机 。 ER 

还 是 用 赛马 的 比喻 ， 可 能 你 不 应 该 图 12-42 一 位 动态 分 文 预 测 的 状态 转移 图 
这 么 快 改变 要 把 赌注 放 在 哪 匹 马上 。 假 设 有 一 匹 马 你 已 经 连续 押 注 三 次 并 且 都 局 了 ， 第 四 
次 ， 另 一 匹 马 赢 了 。 你 真 的 想 要 只 根据 这 一 次 结果 而 不 管 以 前 的 历史 ， 就 把 赌注 压 到 另 一 匹 
马上 ? 这 类 似 于 程序 中 有 航 套 的 循环 时 发 生 的 情况 。 假 设 内 循环 每 执行 四 次 ， 外 循环 执行 一 
次 。 编 译 器 用 条 件 分 文 翻译 内 循环 的 代码 ， 这 个 分 文 会 连续 跳 转 四 次 ， 然 后 会 不 跳 转 一 次 ， 
终止 这 次 循环 。 下 面 是 分 支 选 择 序列 和 基于 图 12-42 的 一 位 动态 预测 结果 。 

Dome: YYYYNYYYYNYY¥Y¥ YN Y ¥ ¥ ¥ N 

预测 结果 : NYY YYNYYYYNYYYYNYYY TY 

预测 错误 : x | X X xx x x X 
采用 一 位 动态 分 支 预测 ， 对 于 每 次 外 循环 ， 内 循环 的 分 文 总 是 会 被 预测 错误 两 次 。 

要 克服 这 个 不 足 ， 常 见 的 做 法 是 采用 两 位 来 预测 下 一 个 分 文 ， 其 思想 是 如 果 分 文 有 多 次 
跳 转 ， 然 后 遇 到 一 次 不 跳 转 ， 那 么 不 用 立即 改变 预测 ; 改变 的 条 件 是 有 两 次 连续 的 不 跳 转 。 
图 12-43 显示 共有 四 种 状态 。 两 个 带 阴 影 的 状态 是 连续 有 两 个 一 样 的 分 文 类 型 时 的 状态 : 前 
面 两 次 分 文 都 跳 转 或 者 都 不 跳 转 。 两 个 
没有 阴影 的 状态 表示 前 面 两 次 分 文 结果 
不 同 。 如 果 是 连续 的 分 文 跳 转 ， 就 处 于 
状态 00。 如 果 下 一 个 分 支 是 不 跳 转 ， 则 
进入 状态 01, 但 是 仍然 预测 此 后 的 分 支 
会 跳 转 。 图 12-43 的 有 限 状 态 机 按照 上 述 
分 文 序 列 执行 的 结果 表明 ， 从 外 层 循 环 
开始 每 次 预测 都 是 正确 的 。 

另 一 项 技术 用 于 深度 流水 线 ， 在 深 图 12-43 ”两 位 动态 分 支 预测 的 状态 转移 图 
度 流 水 线 上 如 果 分 文 预测 错误 ， 处 罚 会 
更 严重 。 这 项 技术 是 复制 流水 线 ， 有 两 份 程序 计数 占 ， 取 指 电路 和 所 有 其 余部 分 。 译 码 一 条 
分 支 指令 时 ， 局 动 这 两 条 流水 线 ， 其 中 一 条 装 人 假设 分 支 不 跳 转 的 指令 ， 另 一 条 装 和 人 假设 分 
支 跳 转 的 指令 。 如 果 发 现 哪 条 流水 线 是 正确 的 ， 就 丢掉 另 一 条 ， 继 续 执行 正确 的 。 这 个 解决 
方案 很 昂贵 ， 但 不 管 分 文 是 跳 转 还 是 不 跳 转 ， 都 没有 气泡 。 

当 一 条 指令 需要 前 面 指令 的 结果 时 ， 就 必须 停顿 直到 得 到 该 结果 ， 此 时 数据 危害 就 发 生 
了 。 这 种 是 写 后 读 (Read-After-Write, RAW) 危害 ， 下 面 的 代码 序列 就 是 这 样 一 个 例子 : 


add $s2,$s2,$s3 # write $s2 
sub $s4,$s4,$s2 # read $s2 
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add 指令 改变 $s2 的 值 ， 这 个 值 用 在 sub 指令 。 图 12-38 表明 add 指令 会 在 写 回 阶段 WB 
结束 前 更 新 $s2 的 值 。 然 后 ，sub 指令 会 在 它 的 指令 译 码 / 寄存 器 文件 读 阶段 ID 结束 前 从 寄 
FF ar EH. Fl 12-44b 给 出 了 有 数据 危害 时 这 两 条 指令 该 如 何 重 又。sub 指令 的 ID 阶段 必 
须 在 add 指令 的 WB 阶段 之 后 。 结 果 是 sub 指令 必须 停顿 ， 产 生 三 个 周期 的 气泡 。 


a) 没有 RAW 危 害 的 连续 指令 


add $s2,$s2,$s3 


sub $s4,$s4,$s2 





b) 有 RAW 人 危害 的 连续 指令 
图 12-44 RAW 数据 危害 对 流水 线 的 影响 


如 果 在 add 和 sub 之 间 有 另外 一 条 指令 没有 和 危害， 就 只 有 两 个 周期 的 气泡 。 如 果 它 们 
之 间 有 两 条 没有 和 危害 的 指令 ， 气 泡 就 会 减少 到 一 个 周期 ， 而 如 果 有 三 条 ， 就 没有 气泡 了 。 观 
察 到 这 些 就 有 一 种 可 能 的 方法 。 如 果 能 够 在 附近 找到 一 些 没 有 危害 而 且 无 论 分 支 结 果 如 何 都 
会 执行 的 指令 ， 为 什么 不 乱 序 执行 它们 ， 把 它们 插入 到 add 和 sub 指令 之 间 填 充气 泡 呢 ? 
反对 这 样 做 的 理由 是 改变 指令 执行 的 顺序 可 能 会 改变 算法 的 结果 。 在 有 些 情 况 中 是 这 样 ， 但 
是 也 不 全 是 。 如 果 一 个 代码 块 中 有 很 多 算术 运算 ， 则 优化 编译 髓 会 分 析 数 据 依赖 ， 重 新 调整 
语句 ， 减 少 流水 线 中 气泡 的 数量 ， 而 又 不 改变 算法 的 结果 。 同 样 ， 一 个 汇编 语言 程序 员 也 可 
以 做 同样 的 事情 。 

这 是 一 个 抽象 付出 代价 的 例子 。 一 层 抽象 本 意 是 通过 隐藏 低层 的 细节 简化 某 一 层 上 的 计 
算 。 如 果 汇 编 语 言 程序 员 或 编译 器 设计 者 不 了 解 LG1 层 流 水 线 的 细节 ， 就 能 生成 对 ISA3 层 
最 方便 的 语句 顺序 ， 事情 当然 更 容易 。 增 加 一 层 抽象 总 是 会 带 来 性 能 损失 。 问 题 是 简化 带 来 
的 好 处 能 不 能 弥补 性 能 损失 。 使 用 LG1 层 的 细节 是 为 了 平衡 性 能 的 简化 抽象 。 这 样 平 衡 的 
男 一 个 例子 是 在 设计 ISA3 程序 时 考虑 高 速 缓存 系统 的 属性 。 

另 一 项 称 为 数据 传送 (data forwarding) 的 技术 能 减轻 数据 危害 。 图 12-38 表明 来 自 
ALU 的 加 法 指令 的 结果 会 在 Ex 阶段 结束 时 随时 钟 进 入 一 个 Ex/Mem 边界 寄存 器 。 对 于 加 法 
指令 ， 只 需 在 Mem 阶段 结束 时 把 结果 送 入 Mem/WB 边界 寄存 器 ， 最 终 在 WB 阶段 结束 时 
进入 寄存 器 体 。 如 果 在 包含 add 结果 的 Ex/Mem 寄存 器 和 sub 通常 会 取出 结果 的 寄存 器 体 
之 间 建 立 一 条 通路 ， 那 么 对 图 12-44b 唯一 要 做 的 调整 就 是 sub 的 ID 阶段 在 add 的 Ex 阶段 
之 后 。 这 样 做 还 是 需要 一 个 气泡 ,但 是 只 有 一 个 周期 。 

超标 量 ( superscalar) 设计 利用 的 是 如 果 两 条 指令 没有 数据 依赖 ， 那 么 它们 就 能 并 行 执 
行 。 图 12-45 给 出 了 两 种 方法 。 图 12-45a 表明 可 以 建立 两 条 独立 的 流水 线 ， 它 有 一 个 速度 
足够 快 的 取 指 单元 ， 能 够 一 个 周期 取出 多 条 指令 ， 还 能 够 每 个 周期 并 发 地 发 射 两 条 指令 。 这 
样 调度 比较 复杂 ， 因 为 要 管理 路 两 条 流水 线 的 数据 依赖 。 
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图 12-45b 是 基于 这 样 一 个 事实 ， 执 行 单元 Ex 通常 是 执行 链 中 最 薄弱 的 一 环 ， 因 为 它 


的 传播 延迟 比 流水 线 中 其 他 阶段 要 长 。 和 整 
SALMA PER, LARSON, M GS ae 
标号 为 FP 的 方 框 是 一 个 浮 点 单元 ， 实 现 的 是 

IEEE 754。 每 个 执行 单元 可 能 比 流水 线 中 其 eer oo be 
他 阶段 慢 三 倍 。 但 是 ， 如 果 它 们 能 并 行 工作 ， a) 双流 水 线 

执行 阶段 就 不 会 拖 慢 整个 流水 线 。 


ALU 
超标 量 机 器 中 ， 指 令 调 度 器 必须 考虑 其 EN 
他 类 型 的 数据 危害 。 当 一 条 指令 在 前 面 一 条 | IF ALU Mem 
指令 读 一 个 寄存 器 之 后 写 这 个 寄存 器 ， 就 会 zie 
发 生 读 后 写 ( Write-After-Read, WAR) 危害 。 


下 面 是 一 个 MIPS 代码 的 例子 。 


add $s3,$s3,$s2 # read $s2 
sub $s2,$s4,$s5 # write $s2 112-45 ”超标 量 机 天 


在 图 12-38 的 流水 线 化 的 机 器 中 ， 这 个 序列 没有 危害， 因为 add 在 它 的 ID 阶段 结束 时 把 
$s2 随时 钟 送 入 ID/Ex 寄存 器 中 ， 而 sub 会 在 它 的 WB 阶段 结束 前 写 这 个 寄存 器 。 超 标量 机 
胡 会 为 了 减少 气泡 调整 这 些 指令 的 顺序 ， 所 以 它 可 能 先 启 动 sub 指令 ， 然 后 再 启动 add。 

在 完美 的 流水 线 中 ,使 用 阶段 流水 线 会 把 时 钟 频率 增加 为 原来 的 k 倍 ， 性 能 也 提高 为 
原来 的 大 倍 。 那 为 什么 不 能 把 这 种 设计 发 挥 到 极致 ， 让 一 个 周期 等 于 一 个 门 延 返 呢 ? 因为 由 
控制 危害 和 数据 危害 引起 的 复杂 性 会 降低 性 能 ， 无 法 得 到 完美 的 结果 。 总 会 到 一 个 点 ， 增 加 
流水 线 的 长 度 和 增加 频率 会 降低 性 能 。 

但 是 提升 时 钟 频率 还 有 一 个 好 处 : 广告 。 个 人 电脑 的 时 钟 频率 是 消费 者 决定 购买 哪 一 
种 电脑 时 的 重要 因素 。 时 钟 频 率 神话 是 说 两 台 具 有 不 同时 钟 频 率 值 的 机 器 ， 时 钟 频率 更 高 的 
机 器 性 能 也 更 高 。 你 现在 应 该 能 明白 为 什么 这 个 神话 不 是 真 的 了 。 增 加 流水 线 中 阶段 的 数量 
会 提高 频率 ， 但 是 也 会 增加 危害 带 来 的 性 能 处 罚 。 问 题 是 设计 是 否 能 有 效 战 胜 这 些 处 罚 。 使 
用 时 钟 频率 作为 衡量 性 能 的 手段 还 忽略 了 图 12-21 中 因素 之 间 的 相互 作用 。 终 极 问题 不 仅 是 
CPU 每 秒 包含 多 少 周期 ， 还 有 每 个 周期 能 做 多 少 有 效 工 作 来 执行 程序 。 

计算 历史 发 展 到 的 现在 ， 流 水 线 技 术 已 经 到 达 一 个 平台 期 。 虽 然 商 用 CPU 芯片 的 时 钟 
速度 还 在 提升 ， 但 是 提升 速度 已 经 大 不 如 前 。 摩 尔 定律 依然 有 效 ， 数 字 电 路 工程 师 能 够 在 心 
片 的 每 平方 训 米 提供 更 多 的 门 ， 但 是 CPU 设计 的 当前 趋势 是 使 用 额外 的 电路 简单 地 复制 整 
个 CPU， 在 一 个 封装 中 装 进 2 一 4 个 CPU， 称 为 核 (core)。 这 种 趋势 未 来 还 会 加 剧 。 这 意 
味 着 软件 设计 者 要 面临 更 大 的 挑战 ， 要 使 用 像 8.3 节 介 绍 过 的 那些 并 行 编程 技术 来 利用 多 核 
CPU 芯片 提供 的 能 力 。 


12.4 结论 


Pep/8 说 明 的 是 冯 … 诺 依 曼 计算 机 的 基本 本 质 。 数 据 区 由 组 合 电 路 和 时 序 电 路 组 成 ， 是 
一 个 大 的 有 限 状 态 机 。 数 据 区 的 输入 包括 来 自主 存 的 输入 和 来 自控 制 区 的 控制 信号 ， 数 据 区 
的 输出 也 送 往 主 存 和 控制 区 。 每 当 控 制 区 回 状 态 寄存 器 发 送 时 钟 脉 冲 时 ， 状 态 机 就 转移 到 一 
个 不 同 的 状态 。 

在 真实 的 计算 机 中 ， 状 态 的 数量 非常 大 ， 但 还 是 有 限 的 。 图 12-2 中 的 Pep/8 数据 区 有 
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24 个 可 写 的 8 位 寄存 器 和 4 个 状态 位 ， 对 于 总 共 192 位 存储 ， 有 2 ”个 状态 。 有 8 个 输入 
来 目 主 系统 总 线 的 数据 线 ，32 个 控制 输入 来 自控 制 区 ， 每 个 状态 的 转移 数 是 2 。 转 移 的 总 
数 是 2“ 乘 以 2 ， 即 2 “=10 。 地 球 上 原子 的 个 数 估计 只 有 10°, m Pep/8 只 是 一 台 很 小 的 
计算 机 ! 在 最 基本 的 层面 上 ， 无 论 系统 多 么 复杂 ， 计 算 都 不 过 是 执行 一 个 有 外 围 存 储 的 有 限 
状态 机 。 


12.4.1 模型 简化 


Pep/8 计算 机 说 明了 真实 的 冯 “' 诺 依 曼 机 器 背后 的 基本 组 织 思 想 。 当 然 ， 还 是 进行 了 很 
多 简化 以 使 机 器 简单 易 懂 。 

有 一 个 低层 细节 与 实际 人 硬件 实现 中 有 所 不 同 ， 那 就 是 在 整个 集成 电路 中 使 用 的 是 边沿 触 
发 的 触发 占 ， 而 不 是 主 - 从 触发 器 。 这 两 种 触发 句 都 能 解决 回馈 问题 。 因 为 主 - 从 原理 比 边 
沿 触 发 原理 更 容易 理解 ， 所 以 描述 中 全 都 使 用 的 是 主 - 从 触发 器 。 

另 一 个 简化 是 使 用 主 系统 总 线 的 CPU 和 主 存 之 间 的 接口 。 在 真实 的 计算 机 中 ， 时 间 约 
束 要 更 复杂 ， 不 是 简单 地 把 地 址 放 到 总 线 上 ， 使 MemRead 保持 有 效 且 等 待 两 个 周期 ， 并 假 
设 数据 就 能 够 随时 钟 送 进 MDR 中 。 一 次 内 存 访问 要 求 不 止 两 个 周期 ， 相 关 协 议 更 详细 地 说 
明 地 址 线 必须 保持 有 效 时 长 ， 以 及 数据 必须 随时 钟 送 入 CPU 寄存 器 中 的 确切 时 间 。 

有 关 主 系统 总 线 的 另 一 个 问题 是 它 是 如 何在 CPU、 内 存 和 外 围 设 备 之 间 共 享 。 实 际 
H, CPU 并 不 总 是 控制 着 总 线 。 相 反 ， 如 果 同 时 有 多 个 设备 想 要 使 用 总 线 ， 总 线 使 用 自己 
的 处 理 需 在 竞争 的 设备 之 间 仲 裁 。 一 个 例子 是 使 用 直接 内 存 访 问 ( Direct Memory Access, 
DMA)， 数 据 从 磁盘 直接 通过 总 线 送 到 主 存 ， 不 受 CPU 控制 。DMA 的 优点 是 CPU 能 够 把 
它 的 周期 用 在 执行 程序 的 有 用 工作 上 ， 而 不 必 分 心 控制 外 围 设备 。 

其 他 一 些 超 出 本 书 讨 论 范 围 的 议题 包括 汇编 右 宏 、 链 接 器 、 流 行 的 外 围 总 线 (比如 USB 
和 Firewire)、 超 级 计算 机 以 及 整个 计算 机 网 络 领域 。 学 习 计 算 机 网 络 时 ， 你 会 发 现 抽象 是 核 
心 。 计 算 机 系统 被 设计 为 抽象 层级 ， 每 一 层 的 细节 都 同上 一 层 隐藏 ， 因 特 网 通信 协议 也 是 这 
样 设计 的 。 每 一 抽象 层 的 存在 都 只 做 一 件 事情 ， 回 更 高 的 一 层 提供 服务 ， 而 隐藏 如 何 提供 服 
务 的 细节 。 


12.4.2 更 大 的 景象 


现在 考虑 一 幅 更 大 的 景象 ， 从 App7 层 一 直 回 下 到 LG1 层 。 假 设 用 户 从 App7 的 一 个 应 
用 程序 问 数 据 库 系统 输入 数据 。 她 想 录 入 一 个 数值 ， 所 以 敲 出 这 个 值 ， 并 执行 回 车 命令 。 这 


样 一 个 看 似 无 害 的 举动 后 面 发 生 了 什么 呢 ? 


C++ 程序 员 编写 的 数据 库 系统 包括 输入 数值 的 过 程 。 这 个 C++ 程序 编译 成 汇编 语言 ， 
SR MBL ot LATTE a SPER TT Sas Sa PE ae, MCSA A tS ILS a. Sat PEA 
和 汇编 堪 是 自动 翻译 医 ， 都 包含 词法 分 析 阶 段 、 语 法 分 析 阶 和 代码 生成 阶段 ， 其 中 词法 分 析 
阶段 是 基于 优先 状态 机 的 。 | 

在 数值 输入 过 程 中 ，C++ 程序 员 也 使 用 有 限 状 态 机 。 编 译 器 把 过 程 中 每 条 C++ 语句 翻 
译 成 多 条 汇编 语言 语句 。 不 过 汇编 器 会 把 每 条 汇编 语言 语句 翻译 成 一 条 机 需 语 言语 句 。 所 以 
处 理 用 户 回 车 命令 的 代码 会 扩展 成 多 条 C++ 命令 ， 而 每 条 C++ 命令 又 会 扩展 成 多 条 ISA3 
层 命令 。 

然后 ， 每 个 ISA3 层 命 令 会 被 翻译 成 控制 区 信号 来 获取 和 执行 指令 。 每 个 控制 信号 输入 
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一 个 复 用 器 或 某 个 其 他 组 合 设备 ， 或 者 这 个 信和 号 是 一 个 脉冲 ， 让 一 个 值 随 着 时 钟 进入 状态 寄 
存 器 。 时 序 电 路 也 是 由 有 限 状 态 机 的 规则 管理 的 。 

每 个 寄存 器 都 是 一 个 触发 器 阵列 ， 每 个 触发 器 都 是 一 对 以 主 - 从 原理 设计 的 锁 存 器 。 每 
个 锁 存 器 都 是 一 对 NOR 门 以 及 简单 的 交叉 耦合 反馈 连接 。 数 据 区 的 每 个 组 合 部 件 都 是 很 少 
几 种 类 型 的 门 的 互联 。 每 个 门 的 行为 都 受 布 尔 代数 定律 的 控制 。 最 终 ， 用 户 的 回 车 命令 被 翻 
译 成 电子 信和 号， 在 各 个 门 中 流动 。 

如 果 在 多 道 程 序 设 计 系统 中 执行 ， 用 户 的 输入 命令 可 能 会 被 操作 系统 中 断 。 回 车 命令 可 
能 会 产生 缺 页 ， 这 种 情况 下 操作 系统 可 能 需要 执行 页 替换 算法 ， 确 定 要 把 哪 一 页 拷贝 回 磁盘 。 

当然 ， 这 些 事件 都 是 在 用 户 对 系统 低层 毫 不 知情 的 情况 下 发 生 的 。 任 何 一 层 的 设计 缺陷 
都 会 减缓 处 理 ， 用 户 会 感知 到 并 且 抱 怨 计 算 机 。 记 住 ， 从 App7 到 LG1， 整 个 系统 设计 都 受 
到 基本 的 空间 / 时间 折 中 的 制约 。 

LGI 层 上 通过 某 个 复 用 器 的 一 个 门 的 信号 和 App7 层 上 执行 回 车 命令 的 用 户 之 间 的 关联 
看 起 来 很 遥远 ， 但 是 它 真 实 存在 。 实 际 上 有 上 百 万 的 门 在 协同 工作 来 执行 用 户 的 任务 。 这 人 么 
多 设备 能 够 被 组 织 成 一 台 有 用 的 机 器 正 是 得 益 于 把 系统 构造 成 不 同 的 抽象 层级 。 

每 个 抽象 层级 都 只 有 少量 的 简单 概念 ， 这 真 的 很 惊人 。 在 LG1 E, RH NAND 或 者 
NOR 门 就 足以 构造 任何 组 合 电路 。 只 有 四 种 基本 的 触发 器 类 型 ， 它 们 都 可 以 用 SR 触发 器 实 
现 。 简 单 的 汉 : 诺 依 曼 周期 是 机 器 运行 背后 ISA3 层 的 控制 力量 。 在 OS4 层 ， 进 程 是 一 个 运 
行 着 的 程序 ， 可 以 通过 存储 它 的 进程 控制 块 来 中 断 它 。Asmb5 层 的 汇编 语言 是 到 机 咒语 言 
的 一 对 一 简单 翻译 。HOL6 层 的 高 级 语言 是 到 低级 语言 的 一 对 多 翻译 。 

有 限 状 态 机 的 概念 在 整个 层次 结构 中 随处 可 见 。 有 限 状 态 机 是 自动 翻译 器 词法 分 析 的 基 
础 ， 也 用 来 描述 时 序 电路 。 进 程控 制 块 存储 着 进程 的 状态 。 

.所 有 科学 都 以 简单 和 结构 化 作为 目标 。 在 自然 科学 中 ， 人 们 致力 于 发 现 自然 法 则 ， 用 最 
少 的 数学 定律 或 概念 来 解释 大 多 数 现象 。 计 算 机 科学 家 也 发 现 简 单 是 控制 复杂 的 关键 。 能 建造 
出 像 计 算 机 这 样 复杂 的 机 器 ， 完 全 是 因为 在 每 个 抽象 层次 只 需要 简单 的 概念 来 控制 它 的 行为 。 


总 结 


中 央 处 理 器 单元 分 为 数据 区 和 控制 区 。 数 据 区 有 一 个 寄存 器 体 ， 部 分 或 全 部 对 ISA3 层 
程序 员 可 见 。 处 理 是 一 个 循环 ,来自 寄存 器 体 的 数据 通过 ABus 和 Bbus， 通 过 ALU, M 
过 CBus 返回 寄存 右 体 。 内 存 地 址 寄存 絮 指 定 地 址 处 的 数据 通过 主 系统 总 线 和 内 存 数据 寄存 
器 从 内 存 注 人 循环 中 。 

控制 区 的 功能 是 向 数据 区 发 送 控制 序列 ， 实 现 ISA3 THOR. PAHS + 诺 依 曼 周 期 控 
fil: 取 指 、 译 码 、 增 加 、 执 行 和 重复 。 在 像 Pep/8 这 样 的 CISC 机 器 中 ， 控 制 信号 必须 引导 
数据 区 取 操 作 数 ， 由 于 寻 址 方式 复杂 ， 这 可 能 要 花费 很 多 周期 。 像 MIPS 这 样 的 RISC 机 器 
则 寻 址 方式 较 少 ， 指 令 比 较 简 单 ， 使 得 每 条 指令 的 执行 都 只 需要 一 个 周期 。 

提高 性 能 可 能 来 自 于 两 个 方面 : 基本 的 空间 /时 间 折 中 和 并 行 性 。 使 用 空间 /时 间 折 中 
的 两 种 一 般 方法 是 分 配额 外 的 硬件 (空间 ) 提高 数据 总 线 的 宽度 ， 或 者 部 署 特殊 的 硬件 单元 ， 
这 两 种 都 会 导致 执行 时 间 降 低 。 

所 有 性 能 提升 都 基于 下 面 这 个 等 式 表 明 的 执行 时 间 的 3 个 组 成 部 分 : 

时 间 _ 指令 、 周 期 、 时 间 
程序 程序 ”指令 周期 
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素 ， 代 价 是 提高 第 一 个 。 这 两 种 组 织 方法 都 会 用 第 三 个 因素 来 提高 性 能 ， 主 要 是 通过 流水 
线 化 。 

具有 复杂 指令 和 较 多 寻 址 方式 的 计算 机 在 计算 历史 早期 比较 流行 。 它 们 的 特征 之 一 就 是 
Mc2 层 抽象 ， 这 层 抽 象 中 控制 区 有 上 自己 的 微 内 存 、 微 程序 计数 硕 和 微 指令 寄存 器 。 控 制 区 的 
微 程序 产生 实现 ISA3 指令 集 的 控制 序列 。 装 入 /存储 计算 机 的 特性 是 没有 Mc2 层 抽象 ， 因 
为 它 的 每 条 简单 指令 都 能 在 一 个 周期 内 实现 。 

高 速 缓冲 人 存储 器 解决 的 是 CPU 的 快速 和 主 存 的 慢 速 之 间 极 端 不 匹配 的 问题 ， 它 依赖 所 
有 真实 程序 中 都 会 表现 出 的 引用 的 空间 和 时 间 局 部 性 。 高 速 缓存 是 一 个 小 的 高 速 内 存单 元 ， 
包含 一 部 分 很 可 能 被 CPU 访问 的 主 存 数据 。 

流水 线 类 似 于 工厂 里 的 装配 线 。 要 实现 流水 线 就 要 划分 周期 ， 在 数据 区 的 数据 通路 上 插 
人 边界 寄存 胡 。 效 果 是 增加 了 每 条 指令 的 周期 数 , 但 是 相应 地 降低 了 时 钟 周期 。 当 流水 线 充 
满 的 时 候 ， 借 助 于 流水 线 固有 的 并 行 性 ， 能 够 实现 每 个 周期 执行 一 条 指令 。 不 过 ， 控 制 危害 
和 数据 危害 会 降低 性 能 ， 不 能 达到 理论 上 的 理想 值 。 


练习 
12.1 节 


1. 画 出 MDR 和 主 存 总 线 之 间 的 全 部 8 位 总 线 ， 给 出 三 态 缓冲 器 和 到 MemWrite 线 的 连接 。 

.设计 图 12-2 的 三 输入 单 输 出 组 合 电路 ANDZ， 用 卡 诺 图 简化 电路 ， 既 考虑 用 AND-OR 来 实现 ， 又 
考虑 用 OR-AND 来 实现 ， 选 择 较 好 的 一 种 。 

. 书 中 提 到 可 以 把 图 12-5 中 的 周期 1 和 周期 3 合并 ， 加 速 汉 ' 详 依 曼 周 期 。 可 以 把 周期 1 和 周期 2 合 
HA? 解释 之 。 

. 书 中 提 到 可 以 把 图 12-5 的 周期 数 从 7 降 到 4， 写 出 4 周期 时 取 指 令 指示 符 和 PC 加 1 的 控制 信号 。 

. 写 出 取 操 作 数 指示 符 和 PC 加 1 相应 的 冯 ， 诺 依 曼 周 期 控制 序列 ， 假 设 已 经 取出 了 指令 指示 符 ， 并 
且 控 制 区 已 经 知道 这 条 指令 是 非 一 元 指令 了 。 

. 书 中 提 到 可 以 把 图 12-10 中 的 周期 数 从 21 降 到 17， 写 出 17 周期 时 实现 采用 间接 寻 址 的 LDX 指令 
的 控制 信号 。 

. 对 于 下 面 每 条 ISA TES, (1) 写 出 它 的 RTL 描述 ,( 2 ) 写 出 实现 该 指令 的 控制 序列 。 假 设 指令 已 经 
取出 ， 如 果 是 非 一 元 指令 就 包括 操作 数 指 示 符 ， 还 包括 保存 状态 位 副本 的 寄存 器 Tlo 


N 


U 


a A 


CN 


N 


*(a) STBYTEA there,n 
(c) STBYTEA there,sf 
(e) STBYTEA there,sx 


(b) STBYTEA there,s 
(d) STBYTEA there,x 
(f) STBYTEA there,sxf 


(g) BR there (h) CALL there 
(i) NOTA (j ) NEGA 

(k) ROLA ( 1) RORA 

(m ) RET4 (n)ADDSP this,i 
(o) SUBSP this,i (p) SUBA this,i 
(q) ANDA this,i (r)ORA this,i 
(s) CPA this,i (t) LDBYTEA this,i 
(u) LDBYTEA this,d (v) MOVSPA 

(w) MOVFLGA (x) RETTR 


8. 写 出 执行 指令 DECO num, i 的 控制 序列 ， 假 设 指令 已 经 取出 。 记 住 ， 这 条 指令 的 操作 码 未 被 实现 ， 
659 你 可 能 想 要 复习 一 下 8.2 节 中 的 陷阱 部 分 。 


12.2 市 


9.* 书 中 预测 不 需要 从 64 位 计算 机 转变 到 128 位 计算 机 ， 因 为 我 们 不 会 需要 大 于 160 亿 GB 的 主 存 。 
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硅 晶 体 是 一 个 由 0.5 nm 的 方 岂 片 组 成 的 平面 ， 每 个 瓦 片 由 两 个 原子 组 成 。(a) 假设 可 以 制造 一 个 
内 存 ， 密 度 高 到 硅 原 子平 面 上 每 个 原子 存储 1 位 (忽略 线 的 互联 问题 )， 要 存储 64 位 机 器 可 以 寻 址 
的 最 大 的 字 节 数 ， 正 方形 必 片 的 边 长 应 该 是 多 少 ?” 给 出 计算 过 程 。(b) 这 个 计算 能 支撑 前 面 的 预测 
吗 ? 解释 之 。 


10. 


人 


23. 


24. 


设计 图 12-17 的 33 输入 16 Fig See Hg EAr, E AD J ate SE a a ADH BY 
图 。 可 以 使 用 省 略 号 〈…)。 


.假设 使 用 图 12-17 中 的 地 址 增 量 需 ， 写 出 执行 练习 7 中 每 条 语句 的 控制 序列 。 
.假设 已 经 完成 了 练习 7 和 11， 对 于 每 条 语句 ， 计 算 使 用 这 个 地 址 增 量 器 引起 的 节省 的 周期 数 百 


分 比 。 


. 假设 使 用 图 12-19 中 的 2 F MDR， 写 出 执行 练习 7 中 每 条 语句 的 控制 序列 。 假 设 所 有 地 址 和 字 


操作 数 都 在 偶 地 址 ， 所 有 字 节 操作 数 都 在 奇 地 址 。 


.假设 已 经 完成 了 练习 7 和 13 ， 对 于 每 条 语句 ， 计 算 使 用 这 个 2 字 节 MDR 引起 的 节省 的 周期 数 百 


分 比 。 


_ASLA 指令 对 累加 器 做 算术 左 移 ， 并 把 结果 放 回 累加 器 中 。ASLA 的 RTL 说 明 表 示 它 会 设置 V 位 ， 


当 数 字 被 解释 为 有 符号 数 时 设置 这 个 位 表示 有 溢出， 这 与 ASRA 不 同 。 如 果 原 始 值 的 符号 和 移 位 
后 的 值 的 符号 不 同 ， 就 发 生 了 溢出 。 移 位 之 后 ，C 位 包含 原始 值 的 符号 ， 而 N 位 包含 移 位 后 的 值 
的 符号 。 所 以 ， 可 以 用 V = CN 计算 V 位 。 幸 运 的 是 Pep/8 ALU 中 有 XOR WHE. (a) 写 出 
实现 ASLA 的 控制 语句 序列 。 需 要 获得 状态 位 的 副本 并 且 移 位 ， 这 样 C A N 的 值 都 会 在 正确 的 
位 置 上 ， 可 以 用 来 计算 V ; 然后 ， 把 两 个 值 XOR 并 存储 Z 位 。 使 用 尽 可 能 少 的 周期 数 。(b) 用 
正确 的 硬件 可 以 在 一 个 周期 内 算出 ASLA 指令 的 V， 设 计 一 个 特殊 的 硬件 单元 来 实现 。(c) 写 出 
用 这 个 新 电路 实现 ASLA 的 控制 序列 。 移 位 指令 本 身 需 要 两 个 周期 ， 设 置 V 又 需要 一 个 周期 。 
(d) 这 个 新 设计 带 来 的 周期 数 降低 百分比 是 多 少 ? (e) 讨论 这 个 硬件 单元 对 CPU 其 余 设计 的 影响 。 
(O 如 果 这 个 硬件 只 能 加 速 指令 集中 一 条 指令 的 V 位 计算 .你 还 认为 这 样 的 硬件 修改 值得 么 ” 解 
FEZ « 
(a) 假设 MIPS 机 器 的 C++ 编译 器 把 $s4 和 数组 a $s5 和 变量 g、$s6 和 数组 b 联系 在 一 起 。 它 
会 把 语句 

a[4]=g+b[5]; 
翻译 成 什么 MIPS 汇编 语言 呢 ? (b) 写 出 (a) 中 指令 的 机 器 语言 翻译 。 


.(a) 写 出 MIPS 汇编 语言 语句 ， 把 寄存 器 $s2 的 内 容 左 移 9 位， 并 把 结果 放 到 $t5 中 。(b) Bit 


(a) PROM OLA a PE. 


. (a) 假设 MIPS 机 器 的 C++ Sa PERE $s4 和 变量 g、$s5 和 数组 a, $s6 和 变量 i 联系 在 一 起 。 该 


如 何 把 语句 g = ali] 翻译 成 MIPS 汇编 语言 呢 ? (b) Gih (a) 中 指令 的 机 器 语言 翻译 。 


. (a) 假设 MIPS 机 需 的 C++ Sa PE ARE $s4 和 变量 g、$s5 和 数组 a、$s6 和 变量 i 联系 在 一 起 。 该 


如 何 把 语句 ali] = g 翻译 成 MIPS 汇编 语言 呢 ? (b) Sih (a) 中 指令 的 机 器 语言 翻译 。 


. (a) 假设 MIPS PLARAY C++ Hark ASE $s4 和 变量 g、$s5 和 数组 a、$s6 和 变量 i 联系 在 一 起 。 该 


如 何 把 语句 g = a[i+3] 翻译 成 MIPS 汇编 语言 呢 ?(b) Sih (a) PROM SLA a ME o 


. (a) 假设 MIPS 机 器 的 C++ 编译 器 把 $s5 和 数组 a、$s6 和 变量 i 联系 在 一 起 。 该 如 何 把 语句 


alil] = a[i+1] 翻译 成 MIPS 汇编 语言 呢 ? (b) SH (a) 中 指令 的 机 器 语言 翻译 。 

(a) 写 出 MIPS 汇编 语言 语句 ， 在 运行 时 栈 上 分 配 12 字 市 的 存储 。(b) 写 出 (a) 中 指令 的 机 器 语 
言 翻 译 。 

(a) 假设 MIPS 机 器 的 C++ 编译 器 把 $s5 和 数组 g 联系 在 一 起 。 该 如 何 把 语句 g = 529371 翻译 
W MIPS 汇编 语言 呢 ? (b) S (a) 中 指令 的 机 上 需 语 言 翻 译 。 

对 于 图 12-32 WAERT, CPU 请 求 在 地 址 4675(dec) 的 字 节 。(a) 标签 字段 的 9 位 是 什么 ? 
(b) 字 节 字段 的 4 位 是 什么 ?(c) 存储 这 个 数据 的 高 速 缓存 单元 是 哪个 ? 
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25. CPU 可 以 寻 址 16 MB 的 主 存 ， 使 用 直接 映射 高 速 缓存 ， 其 中 存储 着 256 个 8 字 节 的 高 速 缓存 行 。 
(a) 一 个 内 存 地 址 需要 几 位 ?(b) 地 址 的 字 节 字段 需要 多 少 位 ? (c) 地 址 的 行 字 段 需要 多 少 位 ? 
(d) 地 址 的 标签 字段 需要 多 少 位 ? (ce) 每 个 高 速 缓存 条 目的 数据 字段 需要 多 少 位 ?〈f) 每 个 高 速 绥 
存 条 目的 所 有 字段 一 共 要 多 少 位 ? (g) 整个 高 速 缓存 总 共 需 要 多 少 位 ? 

26. 练习 25 的 CPU 使 用 的 是 两 路 组 相 联 高 速 缓存 ， 带 有 256 个 8 字 节 高 速 缓存 行 。 每 个 高 速 缓存 条 

目 需要 多 少 位 ? 

.图 12-33 F, (a) 画 出 比较 器 的 实现 ， 比 较 器 就 是 里 面 有 一 个 等 号 的 圆圈 。( 提 示 : 考虑 XOR 后 
面 跟 一 个 反 向 器 的 真 值 表 ， 有 时 称 为 XNOR IJ.) (b) mii 128 个 四 输入 复 用 器 的 连接 。 在 本 习题 
的 两 个 部 分 都 可 以 使 用 省 略 号 (…)。 

. 直接 映射 高 速 缓存 是 高 速 缓存 设计 的 一 个 极端 ， 其 组 相 联 在 中 间 ; 另 一 个 极端 是 全 相 联 高 速 缓存 
(fully-associative cache)， 实 际 上 就 是 图 12-32 的 高 速 缓存 里 只 有 一 个 和 条目， 地址 的 行 字段 为 0， 
也 就 是 没有 行 字段 ， 地 址 中 只 有 标签 字段 和 字 节 字段 。(a) 图 12-33 中 ,不 是 有 8 个 高 速 缓存 单 
元 ,每 个 4 行 ， 而 是 可 以 用 同样 的 位 数 ， 只 有 1 个 高 速 组 存单 元， 该 单元 有 32 行 。 这 个 设计 比 
起 图 12-33 中 的 高 速 缓存 ， 命 中 率 会 提高 吗 ? 解释 之 。(b) 对 于 (a) 中 的 高 速 缓存 ， 读 电路 中 和 需 
要 多 少 个 比较 器 ? 

.假设 CPU 可 以 寻 址 1 MB 的 主 存 ， 使 用 全 相 联 映射 高 速 缓 存 (参见 练习 28 )， 其 中 有 16 个 32 F 
节 的 高 速 缓存 行 。(a) 一 个 内 存 地 址 需要 几 位 ? (b) 地 址 的 字 节 字段 需要 多 少 位 ?(c) 地 址 的 标签 
字段 需要 多 少 位 ? (d) 每 个 高 速 缓存 条 目的 数据 字段 需要 多 少 位 ?7 (ec) 整个 高 速 缓存 总 共 需 要 多 
少 位 ? 

30. (a) 1w 指令 的 RTL 说 明 是 什么 ? (b) 对 图 12-36， 写 出 执行 1w 指令 的 控制 信和 号。 

31. 图 12-38 中 ，(a) 两 个 IF/ID 边界 寄存 器 中 每 个 有 多 少 位 ? (b) 四 个 ID/Ex 边界 寄存 器 中 每 个 有 多 
WAE? (c) 三 个 Ex/Mem 边界 寄存 器 中 每 个 有 多 少 位 ? (d) 两 个 Mem/WB 边界 寄存 器 中 每 个 有 多 
少 位 ? 

32. 对 于 图 12-40b ， 在 下 表 中 检查 每 个 周期 空闲 的 电路 ， 列 出 每 个 周期 空闲 的 电路 总 数 。 


ee ee eas 


2 


N 


2 


Oo 


2 


‘OO 





EE SERRE 


3 


Ww 


.假设 图 12-40a 的 五 阶段 流水 线 15% 的 时 间 在 执行 分 支 ， 每 个 分 支 导致 接 下 来 要 执行 的 指令 停顿 
直到 分 支 完 成 ， 如 图 12-40b 所 示 。( a) 和 没有 气泡 的 理想 流水 线 相 比 ， 周 期 数 增 加 的 百分比 是 多 
>? (b) 假设 n 阶段 流水 线 x% 的 时 间 执 行 分 支 ， 每 个 分 支 导 致 接 下 来 要 执行 的 指令 停顿 直到 分 
文 完 成 。 和 没有 气泡 的 理想 流水 线 相 比 ， 周 期 数 增加 的 百分比 是 多 少 ? 


34. 书 中 提 到 在 假设 下 一 条 指令 会 被 延迟 的 情况 下 ， 可 以 消除 无 条 件 分 支 的 写 回 阶段 。(a) 对 于 


图 12-40b 的 周期 7 一 16 画 出 使 用 这 样 的 设计 。(b) 对 于 该 设计 完成 练习 32 的 表格 。 

. (a) 图 12-42 中 ， 对 于 一 位 动态 分 支 预 测 ， 什 么 样 的 跳 转 结果 会 导致 错误 预测 比率 最 高 ? 最 大 比 
率 是 多 少 ? (b) 图 12-43 中 ， 对 于 两 位 动态 分 支 预测 ， 什 么 样 的 跳 转 结果 会 导致 错误 预测 比率 最 
高 ? 最 大 比率 是 多 少 ? 

36. 构建 图 12-43 的 单 输入 有 限 状 态 机 ， 实 现 两 位 动态 分 支 预测 ， 用 卡 诺 图 简化 电路 。( a) 使 用 两 个 

SR 触发 器 。(b) 使 用 两 个 JK 触发 器 。(c) 使 用 两 个 DD 触发 器 。(d) 使 用 两 个 T 触发 器 。 
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Computer Systems, Fourth Edition 


Pep/8 体系 结构 





本 附录 总 结 了 Pep/8 计算 机 的 体系 结构 。 
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e| 96 | 97 | s| 99 | 100 | won | 102 | 109 | roa | 105 | 106 | 107 | 108 | 109 [uo | ana | 
121 | 122 | 123 | 124 | 12s | 126 | 127 | 
ml [ml [mlm | lm || mem 
ES [173 | 174 





= > [ao [a [a [a [ae [as | 
re [am [ze [ae [a> [aoe [aus [aww [on [oe [20 [0 [a 


图 A-1 十 六 进 制 转换 表 


eras [sae [ram [saw [vee [cae [sean [See 





ae ENN ET EE ion 


图 A-2 ”十 六 进 制 和 二 进 制 的 关系 
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>I 


六 进 制 二 进 制 字符 | 二 进 制 | 十 六 进 制 





S 


010 0101 


| & | 0100110 
+ | 0100111 
010 1000 
010 1001 


B 
04 
o 
06 | 
a 
8 | 
EE 
| oA || » | 010 1010 
ooo toi | 0B || + 
oc | 
| 0D 
œ| 
OOF 
wE 
L 
| 
Le 


25 
26 
27 
28 
29 
2A 


00 0101 
100 0110 


© $ 0100100 
Na En 
aT 


LF 000 1010 


45 
46 


6 


-A 


© 
N 


100 1000 
00 1001 
100 1010 
100 1011 
100 1100 


48 
49 
4A 
4B 
C 
E 


|_| 110 1010 
110 1011 
110 nor 
uoun 


— 


> 
N 


J 


eo 


000 1100 |, | 010 1100 
000 1001 
010 1110 


AG L a 


2E 100 1110 


Trono 
moor 
: 
mrono] 
monr 
ET 
sa a [im i010] a 
| an 7 
c se | mno] e 
w [a forno so O [mno] w 

C | Porno se [= rime] E 


4 
4 
101 0000 5 
101 0001 
101 0010 


"rj 


oor 


011 0000 
011 0001 
011 0010 


30 
31 
32 


001 0001 


— 


WwW 
WwW 


[001 0001 


02 
03 
04 
05 
07 
0A 
0C 
OE 
OF 

0010010| 12 
001 0011 13 
0010100| 14 | 

NAK | 001 0101 

SYN | 001 0110 


ETB 


Foor on 


[16 
M 
= 
EOE 


N 


ve) 
ee 


VT 
FF 
CR 
DLE 
DCI 
DC2 
DC3 
DC4 011 0100 
011 0101 


34 
35 


T 101 0100 


101 0101 





6 
6 
6 
6 
7 
7 
7 
7 
7 
7 
$ 


Ww 
ON 


N N N 
J 


N 


37 
38 
39 
A 


101 0111 


011 1000 101 1000 


F 
0 
l 
2 
3 
4 
5 
6 
7 
8 
9 


A 
C 
E 
F 
0 
5 l 
5 2 
3 3 
3 4 
5 5 
5 6 
5 77 
5 78 
5 79 


101 1010 






onon 
Foor 101 
Foor mo 


Ww 


ESC 
FS 
GS 
US 


? 





控制 符 的 缩写 

NUL 空 字 符 FF 换 页 键 CAN 取消 

SOH 标题 开始 CR 回 车 键 EM 介质 中 断 
STX 正文 开始 SO 不 用 切换 SUB 替补 

ETX 正文 结束 SI 启用 切换 ESC 换 码 (Hih) 
EOT 传输 结束 DLE 数据 链 路 转 义 FS 文件 分 割 符 
ENQ 请 求 DCI 设备 控制 1 GS 分 组 符 
ACK 收 到 通知 DC2 设备 控制 2 RS 记录 分 离 符 
BEL 响 铃 NC3 设备 控制 3 US 单元 分 隔 符 
BS 退 格 DC4 设备 控制 4 SP 空格 

HT 水 平 制 表 符 NAK 拒绝 接收 DEL 删除 

LF 换行 键 SYN 同步 空闲 

VT 垂直 制 表 符 ETB 传输 块 结束 


图 A-3 美国 信息 交换 标准 代码 (ASCII) 
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中 央 处 理 单元 (CPU ) 


N 2 V 


状态 位 (NZVC)“[ | [| | 
ema CEE} se 
sasea oy OO e" 
arilg# co OOOO 2 oa 
es C re 
semea o SE eee CLO 

b) 一 元 指令 


图 A-4 Pep/8 计算 机 的 中 央 处 理 单元 图 A-5 Pep/8 的 指令 格式 


Ca | aaa 
O [om 
a 
EE e 
~ fe 
| aa 
a 
| 
| 


a) 寻 址 -aaa 字段 b) 寻 址 -a 字段 
图 A-6 Pep/8 指令 指示 符 字 段 





















mm | oœ | | om 
| | | Monto | 
C me S oo |O | Men Mem opema 
Cea | on | | menise ropas | 
ro | 
Ca o | e osea 
C ase | mo | | menise opmaspeet | 
O Raag | 1 | sd Mem [Mem [SP + OprndSpec] + X] 


图 A-7 Pep/8 的 寻 址 方式 





NE 
”0000 0010 | MovsPA | 将 栈 指针 (SP) 传送 到 累加 器 (A) 


图 A-8 Pep/8 指令 集 
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wmo | wovrion | #nzvcrseam o o | | 
ol | erR | A 人 ff 支 |ix | 
wo | one | ar | x | 
om fonr | a ae | 
wm | ore | mm ee i | 
[wooo ioe | omne | wrs NH | | 
[coon iia | once | RATS BRC i | 
0001000a | eret | mT. | | 
| ooorooia | sev | mav, ee | eT 
[ore [owe | mG eT we | 
wore [oat | ware CP ue | 
wor 100 [nore | wp | | 
[worn [wer | ap | uv 
oono | wor | WW o 
or | ww | WW | | we 
wow [ror | wearers | ud 
ww | ww | wh | uC e 
oooi | | -Fr G 
9010 tesa | wp | -RRR | | 
im | orco | Ta | ameota | | 
om | so | paeme | ud | 
oora [cnet | MA tae | 
crore | oo | paaa O S Cdr | 
cori | wm | AGE, Wo |u| 
oe | suse | Mi (DME | kantamat | neve | 

1111 raaa 从 寄存 器 r 存 一 个 字 节 到 内 存 


图 A-8 ( 续 ) 


cic ela ral asa 


At KR Pep8 WZH 455 


FBCF| 。 系统 栈 





ET 
ASCH 字 节 的 字符 审 
ar 


















eum | meteron 
Ceo | me OOO 
om | r 


图 A-9 Pep/8 汇编 语言 的 八 个 伪 操 作 图 A-10 ”Pep/8 系统 的 内 存 图 


po NZVC < Mem[SP] (4..7) ;A < Mem[SP+1]; X <- Mem[SP+3]; 
PC < Mem[SP+5]; SP + Mem[SP+7]; 


陷阱 处 理 程序 
e 















寄存 器 传送 语言 说 明 














A< SP 
A(0..11) <0,A (12..15) 4 MZVC 
a 本 二 二 一 





© BRNE | ss Z= 0 = PC + Opmd 
Se a 
C 






ev 







图 A-11 Pep/8 指令 的 RTL 说 明 


456 Ft 有 录 PepSBKAAH 

























[orn | oa | 
[wor | Trp Nomary no open OOO 
| suBSP SP < SP - Oprnd; N & SP < 0, Z< SP = 0, V < {overflow}, C < {carry} 
r& r- Oprnd; N <r <0, Z<r=0, V < {overflow}, C < {carry} 


r r À Opmd;N<r<0,Z<r=0 


寄存 器 传送 语言 说 明 







r&r V Oprmd;N«r<0,Z<r=0 
cPr T r—Oprnd; N <— T <0, Z< T = 0, V & {overflow}, C < {carry} 


a T + Mem[FFFA]; Mem[T-1] < IR; Mem[T-3] < SP: 
Trap 





Mem[T-5] — PC; Mem[T-7] < X; Mem[T-9] < A; 
Mem[T-10] (4..7) — NZVC; SP + T-10; PC + Mem[FFFE] 


图 A-11 (4) 


SP := Mem [FFFA] SP := Mem [FFF8] 
PC := Mem [FFFC] PC := 0000 


图 A-12 ”加载 选项 图 A-13 ”执行 选项 
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第 1 章 


2. (a) 11110， 不 包括 Khan 
3. (a) 


PEEP ALLIED LID LIC ea LS 
4. (a) 参见 图 。(b) 31 


5. 每 秒 32 位 
9. (a) 153 600 (b) 19 200 字 节 ， 大 约 是 19.2KB 
12. (a) 18.5 小 时 





16. 
Temp5 Temp6 
[s.nane [Scrass [5 major [S.state 
[on | Maw | on | [eth | som | time [TX 
17. (a) 


select Sor where S.Name = Beth giving Temp 
project Temp over S.State giving Result 
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1. (a) 4 次 

2. (a) 被 调用 了 7 次。 最 多 有 4 个 栈 帧 。 调 用 顺序 是 : 
主 程序 


Call BC(4, 1) 
Call BC(3, 1) 
Call BC(2, 1) 
Call BC(1, 1) 
Return to BC(2, 1) 
Call BC(1, 0) 
Return to BC(2, 1) 
Return to BC(3, 1) 
Gati BCt2, 0) 
Return to BC(3, 1) 
Return to BC(4, 1) 
Call BC(3, 0) 
Return to BC(4, 1) 
Return to main program 







l 


1 


3. 


第 


l. 


ED 
5. 


7.(a) 00 ~ 11 (bin), EP 0 ~ 3 (dec) (b) 000 ~ 111 (bin), EP 0 ~ 7 (dec) 


8. 


Lz, 
is. 
15. 
1%. 
i. 


2 


一 


22. 


24. 


(a) 参见 图 。 

3 章 

(a) (b) (c) (d) 

267 2102 10101 2433 

270 2110 10110 2434 

271 2111 10111 2440 

272 2112 11000 2441 

273 2120 11001 2442 

274 2121 11010 2443 

275 2122 11011 2444 

276 2200 11100 3000 

277 2201 11101 3001 

300 2202 11110 3002 

301 2210 11111 3003 

(a) 18 (b) 6 (c) 11 (d) 8 (e) 31 (f) 85 
(a) 11001 (b) 10000 (c) 1 (d) 1110 (e) 101 (f) 101001 


(a) C=0, 1110100 (b) C = 1001 0000 (c) C = 1 111 1110 (d) C = 1 000 0000 

(a) 7X8*+ 0x8? + 1x8? + 4x8! + 6x89 

(a) 2xX10'+9x10°+ 4x10'+5xX10°+8xX10° 

(a) 011 0001 (b) 1100101 (c) 000 0000 (d) 100 0000 (e) 111 1111 (f) 111 1110 

(a) 29 (b) -43 (c) -4 (d) 1 (e) -64 (f) -63 

(a) N=0, Z=0, V=0, C=0, 011 1001 (b) N=0, Z=0, V=0, C=1, 0000110 

(c) N=0, Z=0, V=1, C=1, 001 1011 (d) N=1, Z=0, V=0, C=1, 1010110 

(è) N=1, Z=0, V=1, C=0, 1000001 (£) N=1, Z=, V=0, C=0, 1110100 

. (a) 用 二 进 制 表 示 是 10 ~ 01， 十 进 制 表示 是 -2 ~ 1. 

(b) 用 二 进 制 表示 是 100 ~ 011， 十 进 制 表示 是 -4 一 3。 

(a) N=0, Z=0, 010 1000 (b) N=0, Z=0, 0000101 (c) N=1, Z=0, 1101110 

(d) N=1, Z=0, 101 1111 (e) N=1, Z=0, 1000110 (f) N=1, Z=0, 101 1010 

(g) 101 0100 (h) 001 0101 

ASL 操作 : 

(a) 24 (dec) = 001 1000 (bin), ASL 001 1000 = 011 0000 (bin) = 48 (dec) , 
N=0, Z=0, V=0, C=0 

(b) 37 (dec) = 010 0101 (bin), ASL 0100101 = 100 1010 (bin) = -54 (dec) , 
N=1, Z=0, V=1, C=0 

(c) -26 (dec) = 1100110 (bin), ASL 1100110 = 100 1100 (bin) = -52 (dec) , 
N=1, Z=0, V=0, C=1 

(d) 1 (dec) = 000 0001 (bin), ASL 000 0001 = 000 0000 (bin) = 2 (dec) , 
N=0, Z=0, V=0, C=0 

(e) 0 (dec) = 0000 0000 (bin), ASL 000 0000 = 000 0000 (bin) = 0 (dec) , 
N=0, Z=1, V=0, C=0 

(f£) -1 (dec) = 111 1111 (bin), ASL 111 1111 = 111 1110 (bin) = -2 (dec) , 
N=1, Z=0, V=0, C=1 





ASR 操作 : 
(a) 24 (dec) = 001 1000 (bin), ASR 001 1000 = 000 1100 (bin) = 12 (dec) , 
N=0, Z=9, C=0 
(b) 37 (dec) = 0100101 (bin), ASR 010 0101 = 001 0010 (bin) = 18 (dec) , 
N=0, Z=0, C=1 
(c) -26 (dec) = 1100110 (bin), ASR 1100110 = 111 0011 (bin) = -13 (dec) , 
N=1, Z=0, C=0 
(d) 1 (dec) = 000 0001 (bin), ASR 000 0001 = 000 0000 (bin) = 0 (dec) , 
N=0, Z=1, C=1 
(e) 0 (dec) = 0000 0000 (bin), ASR 000 0000 = 000 0000 (bin) = 0 (dec) , 
N=0, Z=1, C=0 
(f) -1 (dec) = 111 1111 (bin), ASR 111 1111 = 111 1111 (bin) = -1 (dec) , 
N=1, Z=0, C=1 
27. (a) 101 1011, C=0 (b) 101, 1011, C=0 (c) 1010101, C = 1 (d) 001 1011, C=1 
30. (a) 3AB7, 3AB8, 3AB9, 3ABA, 3ABB, 3ABC 
31. (a) 11 614 (dec) 
32. (a) 68CF 
34. (a) -35 (b) 47 (c) -64 
36. (a) 65 (hex)(b) 3F (hex)(c) 7F (hex) 
36. Have a nice day! 
40.101 000 1100001 11110001 0100000 0100100 0110000 0101110 0111001 0110010 
43. (a) 八进制 数字 表示 3 位 。 
44. (a) 6.640625 (b) 0.046875 (c) 1.0 l 
46. (a) 1101.00101 (b) 0.0000101 (c) 0.10011001100... 
50. (a) 1 110 1001 
51. (a) 0.90625 
52. (a) 41D8 D000 
53. (a) 64.0=1.0X 2° 


第 4 章 
1. (a) 65 536 ZF (b) 32 768 F (c) 524 288 位 (d) 92 位 (e) 大 5699 1% 
3. 对 于 指令 7AF82C 对 于 指令 D623D0 
(a) opcode=0111 (a) opcode=1101 
(b) 这 条 指令 把 一 个 数 加 到 寄存 器 (b) 从 内 存 加 载 一 个 字 节 到 寄存 器 
(c) r=1 (c) r=0 
(d) 变 址 寄存 器 ，X (d) RIM, A 
(e) aaa=010 (e) aaa=110 
(f) 间接 寻 址 (f) 栈 间接 寻 址 
(g) OprndSpec=F82C (g) OprndSpec=23D0 
sA 
A x Mem[0A3F] Mem[0A41] 
原始 内 容 19AC FE20 FF00 103D 
(a) WRIA EF00 FE20 FF00 103D 


(b) 加 载 字 节 到 累加 器 19FF FE20 FF00 103D 


(c) 加 载 字 节 到 变 址 寄存 器 19AC FE10 FF00 103D 
(d) 存储 字 节 累加 器 19AC FE20 FF00 AC3D 
(e) 存储 变 址 寄存 器 19AC FE20 FE20 103D 
(f) 从 变 址 寄存 器 减 去 19AC EDE3 FF00 103D 
(g) 从 累加 器 减 去 1AAC FE20 FF00 103D 
(h) OR RNAF FFAC FE20 FF00 103D 
Ci) FEREN AF 7 ae 19AC 01DF FF00 103D 

7. JOY 

9. (a) M 

第 5 章 


1.(a) ORX OxEF2A, n (b) MOVSPA (c) LDBYTEA 0x0030, sxf 
3.(a) IC (b) 4B00F (c) OCO1E6 
5.(a) 42 65 61 72 00 (b) F8 (c) 0316 
7. mug 
10. -57 
72 
Hi 
12. (a) 目标 代码 是 38 00 6D 50 00 OA 38 6D 50 00 OA 50 00 26 00 
输出 
109 
28013 
& 
13. here 的 值 是 0003, there 的 值 是 0005。 目 标 代码 是 04 00 05 00 09 39 00 03 00 
15. this 的 值 是 0000， 输 出 是 Q， 因 为 S1 (hex) = Q (ASCID ， 这 里 的 51 是 目标 代码 的 第 一 个 字 节 。 
18. 编译 器 用 它 的 符号 表 来 存储 每 个 变量 的 类 型 ， 每 当 遇 到 表达 式 或 赋值 语句 时 ， 编 译 器 就 会 查询 符号 
表 ， 验 证 类 型 是 否 兼容 。 
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3. 因为 无 论 控制 来 自 0009 的 STA 还 是 循环 底部 的 BR，i 的 当前 值 都 会 放 在 累加 耸 中 。 在 循环 底部 
的 BR 之 前 ， 累 加 器 用 于 i 的 增加 ， 因 此 当 cPA 执行 时 ，i 的 当前 值 仍然 会 在 累加 器 中 。 
6. CPU Mem CPU Mem 


Pc FBCD[ 7 
sr FBCF 


8. 分 支 地 址 计算 如 下 
Oprnd=Mem[OprndSpec + X] 
=Mem[0013 + 8] 
=Mem[00B] 
=4100 
从 程序 代码 中 无 法 看 出 4100 处 的 内 容 是 什么 假设 它们 为 全 0， WAB WR E HA jE hE 
4100 处 的 00 当 作 STOP 指令 。 


第 7 章 
1. 计算 机 科学 的 基本 问题 是 : 什么 能 够 自动 化 ? 









PC | 0003 FBCD | 0025 


sp FBCF 


3. (a) <identifier> = <identitier> <digit> 
=> <identifier> 3 


= <identifier> <digit> 3 


=> <identifier> 2 3 


=> <identifier> <digit> 2 3 


=> <identifier> 1 2 3 


=> <identifier> <digit> 1 2 3 


= <identifier> c 1 2 3 


= <identifier> <letter> c 1 2 
-> <identifier> bc 1 2 3 


=> <letter> bc 1 2 3 


S82 PD Cig 3 
| 
4. (a) 1 全 FM a“ >» 
=M Rule2 
= — d Rule5 | | 


Sla Asabc Rule 2 
sa bec Rule 5 


6. (a) 可 以 按照 如 下 方式 推导 : 


T. ( a) <statement> 


<compound-statement> 


和 


<identfier> 


/ 


<letter> 


/ 


a 


wee 


EDL IBLAERE 


<identifier> 


a 


<identifier> 


ee 


<identifier> 


<identifier> 


a 


<identifier> 


> Me 
\ 


\ 
/ 


5 — i — 4 — m — aiy 


b 


Wt 


ge 


<letter> 


a 


<letter> 人 


es 


{ <declaration-list> 


€ 


<statement-list> 


<statement> 


<selection-statement> 


f ( <expression> ) pa 


Cl <expression-statement> 


<expression> 


S1 


<statement-list> 


<statement> 


} 


<expression-statement> 


p> 


<expressior> 


$2 


“gg 


<digit> 


Rey 


<digit> 


ea 


] 


Pa 
2 


461 


<digit> 


M 


3 


462 BIEBER 


8. (a) 11.(a) 该 状态 机 是 确定 的 。 没 有 不 可 达 状 态 。 


<stulement> 


| 13.(a) 一 >(A) >(B) OA 


<expression-statement> 


<expression> 


<identifier> ii <expression> 
alpha <relational-expression> 


<additive-expression> 


<multiplicative-expression> 


<unary-expression> 


<primary-expression> 


| 


<constant{> 

第 8 章 

2. (a) 0036 (hex)， 是 第 27 个 字 节 中 6 对 应 的 ASCH 码 ，6C 

4. (a) 0031， 被 中 断 指令 的 指令 指示 符 

5. (a) 0039， 被 中 断 指令 的 指令 指示 符 

6. (a) 0041， 被 中 断 指 令 的 指令 指示 符 

7. (a) 指令 通过 掩 码 左边 的 四 位 ， 把 累加 器 的 值 从 0033 ( 即 3 的 ASCI 值 ) 改变 为 0003。(b) 0007, 
37 中 第 二 个 字符 的 数值 。(c) 0000, init 的 值 ， 起 始 状态 。 

8. 提示 : 第 一 个 字符 输入 是 ASCII 的 连接 符 字 符 。 

9. (a) 0025 (hex), BẸ 37 (dec). (b) 0025, 没有 取 反 ， 因 为 它 已 经 是 非 负 的 了 。(c) FF78 的 CALL 是 
HFS 100 的 位 置 。 累 加 器 的 值 还 是 0025， 即 37 (dec)， 因 为 37 mod 100 就 是 37。 

10. 提示 : -2068 (dec) = F7EC (hex)， 它 的 补 码 是 0814 (hex). 

11. (a) 0012， 要 输出 的 字符 串 的 第 一 个 字 节 的 地 址 (b) 0054, FÈ T HI ASCI 值 

12. (a) 0008, DECI 后 面 一 条 指令 的 地 址 (b) 0006, DECI 操作 数 指示 符 的 地 址 (c) 0003, DECI 操作 
数 的 地 址 

18. (a) 算法 不 能 保证 互 斥 。 假 设 P1 和 P2 都 在 它们 各 自 的 其 余部 分 中 ，enterl 和 enter2 均 为 假 。 
P1 可 以 执行 它 的 while 循环 测试 ， 然 后 被 中 断 ， 此 后 P2 会 执行 它 的 while 循环 测试 。 然 后 它们 
可 能 把 各 目的 Enter 变量 赋值 为 真 ， 同 时 进入 临界 区 。 

20. (a) S 和 0， 没 有 被 阻塞 的 进程 。 

22. (a) 算法 能 保证 互 斥 。 

24. (a) 不 再 能 保证 互 斥 。 能 找到 一 个 序列 使 得 Pl 和 P2 同时 进入 它们 的 临界 区 吗 ? 不 过 ， 不 会 出 现 死 锁 。 

25. (a) pe (b) 不 包含 循环 ， 所 以 没有 死 锁 : 


C) 


aO 4) © 


© 
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2. (a) 一 个 边界 寄存 器 就 足够 了 ， 因 为 每 次 只 能 有 一 个 进程 在 执行 。 如 果 用 户 进程 试图 访问 逻辑 地 
址 空间 外 的 内 存 地 址 ， 硬 件 必 须 中 断 页 表 的 访问 ， 因 为 该 页 不 在 主 存 中 。 能 对 图 9-9 做 这 样 的 修 
改 吗 ?操作 系统 必须 记录 多 少 边界 寄存 器 ?每 个 进程 一 个 ， 页 表 中 每 个 页 一 个 或 者 每 个 主 存 帧 
=a? 

4. (a) 2° mM 4098 字 节 。 

6. 那些 脏 位 值 为 N 的 页 ， 也 就 是 帧 2、5 和 6 中 的 页 。 

8. 一 个 分 配 了 三 帧 的 作业 的 页 访问 序列 的 起 始 是 1, 2, 3, 1, 4, 2，…， 对 这 个 序列 FIFO 有 四 次 缺 页 ， 
LRU 有 五 次 缺 页 。 能 继续 完成 这 个 序列 使 得 FIFO 在 这 个 特殊 的 情况 下 更 好 么 ? 

10. 产生 五 次 缺 页 ， 相 比 之 下 FIFO 是 七 次 ，LRU 是 六 次 。 可 以 追踪 该 算法 验证 这 张 图 。 

11. (a) 提示 : 最 糟 的 情况 是 读 / 写 头 刚 好 经 过 块 的 起 始 位 置 。 因 此 ， 磁 盘 必 须 完整 转 一 圈 。 可 以 从 
RPM 数 算出 这 个 时 间 。 

12. (a) 四 个 数据 位 (b) 一 个 奇偶 位 

16. (a) 错误 发 生 在 位 置 2。 纠 正 后 的 编码 是 1101 1010 1001。 
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1. (a) x+1=x+(x+x’) 互补 律 
='( x +e" ) 4" 结合 律 
=x +x’ bee 
=] 互补 律 


4. 要 证 明 a+ b 的 补 是 a'b'， 必 须 证 明 
(a+b): (a rb ) =0A (a+b) + (a! bb ) = 1 
证 明 的 第 一 部 分 如 下 
(a+D).(a' +b’) =[(a’ +b’ )-al]+[ (a 0 ) 0 交换 律 
=[(a’ -a)-b’ ]+ fa’ -(b-b')] 交换 律 ， 结 合 律 


= [0 - b’ ]+ [a - 0] 互补 律 
= 0 恒 等 律 
6. (a) fim: 
(x+y) O +p) = Oa (y +2’) 交换 律 
=y+(x-x') 分 配 律 
等 


8. (a) a 
b 
C 
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9. (a) 任何 集合 和 空 集 的 并 都 是 它 自 己 。 
10.(a) 









(1) œ +y) (2)z 


(4)x 


15. (a) ， > = ; ie Do ayy O | 


a'b + ab’ 


19. (a) y(a, b, c) = a'bc + ab'c' 
20. (a) ya. b,c) = (at+bt+c)(atb+c')\atb'+c)(a'+b+c')(a’'+b' +c)(a'+b' +c’) 
21. (a) ab+a'b' (d) a'b+ab 22. (a) 


(b) 
a' a' 
b' b 





24. 


2T: 
29. 


3L. 
a3: 
34. 


32. 
38. 


40. 
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(b) a’ 25. (a) a 
b' 


b' b 
(a) X(0,3) (d) 21, 3) 28..(a) TK; 2) 


ta) x= ae 30. (a) x = a'c 


a' a’ 
0 
C 
l 
c 
0 


(a) xla, b O = ae the 32. W) sa b c) = TI, 2,3,6) = late +c’) 

(a) X04, 6, c} = be’ + whe + bed" 

(a) T](0, 1, 6, 7, 8, 9, 11, 14, 15), x(a, b, c, d) = (b +e)(b' + c')(a'+c'+d') 或 者 x(a, b,c, d) = (b +c) 
(be la tb+d ) 

(a) x(a, b,c) =a'b'+ab. 36. (a) x(a, b,c, d) = be + bd 

(a) 控制 线 作 为 使 能 ， 当 控制 线 为 0 时， 数据 会 不 改变 地 通过 ; 当 控 制 线 为 1 时 ， 会 禁止 输出 ， 输 
出 被 设置 为 1， 无 论 数 据 输入 是 什么 。 


D0 一 
D1} 
pi- 
D3 — 


D4 — 
DS 
D6 — 
D7 — 


D8 — 
D9 — 
D10— 
Dil 一 


D12 一 
D13 一 
D14 一 
D15 一 
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42, (b) 46. (a) Cin Ma 
A 
B 

Carry 


(b) 最 大 3 个 门 的 延迟 。 





47. (b) 提示 : 如 果 看 一 下 图 10-52， 全 加 器 有 3 个 门 延迟 ， 半 加 器 有 一 个 门 延迟 ， 所 以 整个 的 门 延迟 
是 10。 不 过 ， 其 实 比 这 个 数值 小 。 


第 11 章 

1. 如 果 有 偶数 个 反 相 器 ， 网 络 会 稳定 。 

3. A B g D E 
(a) 0 0 1 1 0 
(b) 0 0 0 0 0 

5. (b) l 


LD: 


9. (a) 提示 : 使 得 主 和 从 触发 顺 为 0，Clear 输入 应 该 (1 ) 迫使 从 触发 器 连接 到 主 触 发 器 ， 无 论 反 相 
俘 的 输出 是 什么 ,2 ) 迫使 主 触发 需 变 成 Q = 0 状态 。 要 实现 (2 )， 考 虑 增加 第 三 条 输入 线 ， 连 接 
到 主 NOR 门 中 的 一 个 ， 或 者 第 三 条 输入 线 连接 到 主 AND 门 中 的 一 个 。 





13. (a) DA=AXI+AXI+ABX2+BX1X2 15, (a) JA—=]BCX+BCX KA=BCX+BCX 
DA = BX1+BxX1 X2+ABXI in=CxX+CxX KB =CX+CxX 
Y= AX2+AXI1 X2 JC=1 KB = 1 

第 12 章 


7. (a) // STBYTEA there,n 
// RTL: byte Oprnd <- r<8..15> 
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// Oprnd = Mem{Mem(OprndSpec]] 


// T3<high> <- Mem[OprndSpec] 

1. A=9, B=10; MARCk 

2. MemRead 

3. MemRead, MDRMux=0; MDRCk 

4. AMux=0, ALU=0, CMux=1, C=14; LoadCk 


// T2 <- OprndSpec + 1 
5. A=10, B=23, AMux=1, ALU=1, CMux=1, C=13; CCk, LoadCk 
6. A=9, B=22, AMux=1, ALU=2, CMux=1, C=12; LoadCk 


// T3<low> <- Mem[T2] 

7. A=12, B=13; MARCk 

8. MemRead 

9. MemRead, MDRMux=0; MDRCk 

10. AMux=0, ALU=0, CMux=1, C=15; LoadCk 


// Mem[T3] <- A<low>, restore C in Tl from Fetch 
11. A=14, B=15; MARCk 

12. A=1, AMux=1, ALU=0, CMux=1, MDRMux=1; MDRCk 
13. MemWrite 

14. MemWrite, A=11, AMux=1, ALU=15; CCk 


You can combine cycles in the above solution to get an implementation with only 12 

cycles as follows: 

// T3<high> <- Mem[OprndSpec], T2 <- OprndSpec + 1 

1. A=9, B=10; MARCk 

2. MemRead, A=10, B=23, AMux=1, ALU=1, CMux=1, C=13; CCk, LoadCk 

3. MemRead, MDRMux=0, A=9, B=22, AMux=1, ALU=2, CMux=1, C=12; 
MDRCk, LoadCk 

4. AMux=0, ALU=0, CMux=1, C=14; LoadCk 


// T3<low> <- Mem[T2] 

5. A=12, B=13; MARCk 

6. MemRead 

7. MemRead, MDRMux=0; MDRCk 

8. AMux=0, ALU=0, CMux=1, C=15; LoadCk 


// Mem[T3] <- A<low>, restore C in Tl from Fetch 
9. A=14, B=15; MARCk 

10. A=], AMux=1, ALU=0, CMux=1, MDRMux=1; MDRCk 
11. MemWrite 

12. MemWrite, A=11, AMux=1, ALU=15; CCk 


9. 提示 : (a) 使 用 160 1Z GB 等 于 16X10?X10? 字 节 ， 世 片面 积 是 4x4 平 方 米 ， 但 是 必须 给 出 计算 过 
程 。(b) 是 的 ， 但 是 必须 给 出 解释 。 


16. (a) Iw $t0,20($s6) # Register $t0 gets b[5] 
add $t0,$s5,$t0 # Register $t0 gets g + b[5] 
sw $t0,16($s4) # a[2] gets g + b[5] 


(b) 100011 10110 01000 0000000000010100 
000000 10101 01000 01000 00000 100000 
101011 10100 01000 0000000000010000 


R 


5| 


索引 中 的 页 码 为 英文 原 书页 码 ， 与 书 中 页 边 标 注 的 页 码 一 致 。 


A 


Absorption property (吸收 率 )， 参 见 Boolean 
algebra (吸收 率 )，Boolean algebra 
Abstraction (#42), 3-10 
definition of (抽象 的 定义 )，3 
in computer system (计算 机 系统 中 的 抽象 )， 
8-10, 300, 657 
Add instruction (加 法 指令 )，Pep/8，160-161 
add instruction, MIPS (add 指令 ，MIPS)，629，645- 
646 
ADDA instruction, Pep/8 (ADDA 指令 ，Pep/8 ), 
198-200, 607-608, 624 
Adder (JIA 4), 528-531 
full (全 加 器 )，529 
half ( 半 加 器 )，528 
ripple-carry (ÍTEM AE), 530-531 
Adder/subtracter (加 法 器 / IRIA AF), 531-532 
Addition (加 法 ) 
signed (有 符号 加 法 )，97-99，537-539 
unsigned (无 符号 加 法 )，95-96 
16-bit with two 8-bit (用 8 位 实现 16 位 加 法 )， 
538-539 
Address decoding (地 址 译 码 )，582-588 
Addressing modes，MIPS,( 寻 址 方式 ，MIPS) 626 
base ( 基 址 寻 址 )，627，630，645 
immediate (立即 数 寻 址 )，627，632-633 
PC-relative (PC 相对 寻 址 )，627，644-645 
pseudodirect( 伪 直接 寻 址 )，627，644 
register (寄存 器 寻 址 )，627，629，645-646 
Addressing modes, Pep/8 (4k 7 xk, Pep/8), 
154-156, 192, 285, 605 
direct (kht), 157-158, 606-607 
immediate (立即 数 寻 址 )，202-203 607-608 
indexed (48h: Fh), 287-288, 299-300, 630 


indirect (间接 寻 址 )，305-306，608-611 
stack-indexed〔( 栈 变 址 寻 址 )，290-291 
stack-indexed deferred〈 栈 变 址 间接 寻 址 )， 
295-297, 318-319 
stack-relative (FRA XTE Ht), 238-241 
stack-relative deferred ( 栈 相 对 间接 寻 址 )， 
276-277，309 
trap assertion〈 陷 阱 断言 )，401-403 
trap operand computation (陷阱 操作 数 计 算 )， 
403-406 
.ADDRSS pseudo-op ( .ADDRSS HRE), 194, 299 
ADDS? instruction (ADDSP #84), 238 
Aiken, Howard H., 89 
Alphabet (FHR), 332, 335 
Algorithm (算法 )，17 
ALU, 532-540 
American Standard Codard Code for Information 
Interchange (美国 信息 交换 标准 代码 )， 参 见 
ASCII 
Analysis vs.design (分 析 与 设计 ) 
hardware〈 硬 件 )，565 
software (软件 )，20-22 
AND gate (AND 门 )，497-499 
AND operator (AND 运算 符 )，107-108 
AND-OR circuit (AND-OR 电路 )，506-509 
And instruction (43484), 162-163 
App7, 8-10 
Arithmetic Logic Unit (算术 逻辑 单元 )， 参 见 
ALU 
Arithmetic shift left ARE). AJIL ASL 
Arithmetic shift right (算术 右 移 )， 参 见 ASR 
Arrays( 数 组 )， 参 见 Parameter (人 参数) 
in C++ (C++ 中 的 数组 )，46-47 
called by reference in C++ (C++ 中 的 传 引 用 


调用 )，61 

global (全 局 数组 )，285-288 

local (局 部 数组 )，288-291 

MIPS (MIPS 数组 )，631-632 
ASCII, 115-117 
„ASCII peeudo-op ( .ASCII 伪 操作 )，194，195- 
196, 215-217 
ASL operation (ASL j@#-), 109-111 
ASLR instruction (ASLr #84), 224-226 
ASR operation (ASR 324), 109-111 
ASRr instruction (ASRr #84), 224-226, 611-612 
Assemler (Waar), 196-197 

cross (26 LIL ags), 201-202 

resident (#347 4a), 201-202 

using Pep/8 (Pep/8 的 汇编 器 )，200-201 
Assignment operator (赋值 操作 )，38 
Assignment statement (赋值 语句 )，218-221，228 
Associative law (结合 律 )， 参 见 Boolean algebra 
Asynchronous interrupt (异步 中 断 )，420-421 


B 


Backun Naur Form ( 巴 科 斯 范式 )， 参 见 BNF 
Base conversion (基数 转换 ) 
floating point ad decimal ( 浮 点 数 和 十 进 制 数 )， 
118-127 
hexadecimal and decimal (十 六 进 制 数 和 十 进 
制 数 )，113-115 
signed integer and decimal (有 符号 整数 和 
十 进 制 数 )，101-104 
unsigned integer and decimal (无 符号 整数 和 
十 进 制 数 )，93-94 
Base register (AEH: AF AF aE), AIL Register 
BCD, 134 
Belady’s anomaly (Belady F% ), 463-464 
Best-fit algorithm (最 优 适 配 算 法 )，453-454 | 
Binary coded decimal (二 进 制 编码 的 十 进 制 数 )， 
参见 BCD 
Binary decoder (i fil] PEAS 45), 526-527 
Bit (位 )，90 
BLOCK pseudo-op (.BLOCK HRE), 194, 197-198 
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BNF, 344 

Boolean algebra (布尔 代数 )，491-197 
absorption property (吸收 属性 )，494 
associative law (结合 律 )，493 
axiom (定理 )，492 
complement (互补 律 )，496-497 
consensus theorem (一 致 性 定理 )，494 
DE Morgan’s law ( 德 . 摩根 定律 )，495-496 
distributive law (分 配 律 )，492 
duality (对 偶 性 )，492 
idempoteent property (FF), 493-494 
zero theorem (TÆ), 494 

Boolean expression〈 布 尔 表达 式 ) 
and logic diagram (和 逻辑 图 )，5$01-503 
and truth table (和 真 值 表 )，503-506 

Boolean operator (布尔 运算 符 )，42 

Boolean type (布尔 类 型 )，281-284 

Bound register (边界 寄存 器 )， 参 见 Register 

BR instruction (BR 指令 )，203-206 

BRC instruction (BRC 指令 )，244 

BREQ instruction (BREQ 指令 )，244 

BRGE instruction (BRGE 指令 )，244 

BRGT instruction (BRGT 指令 )，244 

BRLE instruction (BRLE 指令 )，244 

BRLT instruction (BRLT 指令 )，244 

BRNE instruction (BRNE 指令 )，244 

BRV instruction (BRV 指令 )，244 

.BURN instruction (.BURN 伪 操 作 )，194，392-393 

Bus (总 线 )，11，575-576 
width (总 线 宽度 )，613-615 

Byte〈 字 节 )，13 

BYTE pseudo-op (.BYTE 伪 操 作 )，194，198-200 


C 


C bit (C fiz), 96, 105, 150-151, 532, 533, 599 
C++ 
compiler (TEF), 33-34, 214-218 
compiler, optimizing (编译 器 ， 优 化 )，、246-247 
machine independence (机 器 无 关 性 ) 34 
memory model (内 存 模型 )，35-36 
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memory model，heap (内 存 模型 ， 堆 )，303 
Cache memories (高 速 缓冲 存储 器 )，634-642 
direct-mapped (直接 映射 )，637-638 
fully-associative，Exercise12.28 (全 相 联 ， 
练习 12.28 )，662 
locality of reference (引用 局 部 性 )，635 
MIPS, 642-644 
set-associative (ZH #H#K), 639-642 
write policies (SRI), 639-642 
CALL instruction (CALL #84), 260-263 
Call-by-reference parameter ( 传 引用 参数 )， 参 见 
Parameter 
Call-by-value parameter ( 传 值 参数 )， 参 见 Parameter 
Canonical expression (范式 )，510-511 
Carry bit CHII), AJ C bit 
Central Processing Unit ( CPU ， 中 央 处 理 单元 ))， 
11, 16-17 
MIPS, 642-646 
Character input/output instruction (字符 输入 / 输 
出 指令 )，166-168 
Character representation (字符 表示 )，115-118 
Characteristic table (特征 表 )，558 
for D flip-flop (D Ak), 562 
for JK flip-flop (JK 触发 器 )，560 
for SR flip-flop (SR 触发 毅 )，558 
for T flip-flop (T 触发 器 )，563 
CHARI instruction (CHARI 78), 197-198, 218-221 
CHARO instruction (CHARO 484), 195-196 
cin statement (cin 语句 )，218-221 
CISC, 620 
Clear flip-flop line (清除 触发 器 线 )，569 
Clocked SR flip-flop〈 钟 控 SR 触发 器 )，552-554 
Closure of an aiphabet (字母 表 的 闭 包 )，333 
Code generator (代码 生成 嚣 )，331，368-381 
Combinational circuit (组 合 电路 )，490-491 
Compiler (编译 器 )， 参 见 C++ 
Complements (互补 律 )， 参 见 Boolean algebra 
Concatenation (连接 )，333 
Concurrent processes (并 发 进程 )，424-425 
Consensus theorem (合意 定理 )， 参 见 Boolean 


algebra 

Constants (常数 )，226-228 

Context sensitive grammar (上 下 文 相 关 语 法 )， 
338-339, 346 

Conversion between base (不 同 基数 之 间 的 转换 )， 
参见 Base conversion 

cout statement (cout 语句 )，215-221 

CPr instruction (CPr 4#§4), 247-249 

Critical section (Ii F#i KX), 426-427 


D 


D flip-flop (D fh #%), 562-563 

Date forwarding (数据 传送 )， 参 见 Pipelining 

Database system (数据 库 系统 )，22-27 

Deadlock ( 死 锁 )，435-437 

DECI instruction (DECI 指令 )，194，203-206， 
218-221, 396, 408-414 

DECO instruction (DECO4#4), 196, 203-206, 
396, 414-417 

Decoder ( 译 码 器 )， 参 见 Binary decoder 

delete operator (delete 操作 符 )，35，74 

De Morgan’s law (7 - 摩根 定律 )， 参 见 Boolean 
algebra 

Demultiplexer (RHE), 527-528 

Denormalixed numbers ( 非 正 规 化 数 )，125 

Derivations in a grammar (语法 推导 )，336 

Deterministic FSM (确定 性 FSM)， 参 见 Finite 
state machine 

Direct addressing (直接 寻 址 )， 参 见 Addressing 
modes 

Direct memory access (直接 内 存 访问 )，656 

Disassemblers( 反 汇编 器 )，209-211 

Disk drives (H&ERIKA ak), 465-466 

Distributive law (分 配 律 )， 参 见 Boolean algebra 

Division (PR) 

integer vs. floating point( 整 数 与 浮 点 数 )， 
40-41 

do loop (do 循环 )，45-46，250-252 

Don’t care condition (无 关 条 件 )， 参 见 Karnaugh 

DRAM, 581 


Duality (对 偶 性 )， 参 见 Boolean algebra 

Drnamic branch prediction (动态 分 支 预 测 )， 参 见 
Pipelining 

Dynamic memory allocation (动态 内 存 分 配 )，74-80 


E 


Eckert, J. Presper, 90, 225 
Edge-triggered flip-flops (边缘 触发 的 触发 项 )，555 
EEPROM, 581 
Empty string ( 空 字 符 串 )，333 
Empty transition (空转 移 )，349-351 
Enable lines (使 能 线 )，523-525 
.END pseudo-op (.END 伪 操 作 )，194，195-196 
ENIAC computer (ENIAC 计算 机 )，90 
EPROM, 581 
-EQUATE pseudo-op ( . EQUATE fh ## E), 194, 
226-228, 243 
Error-correcting codes (24 #74), 472-476 
Error-detecting codes (#744), 470-472 
Excess representation ( 余 码 表示 )，120-121 
Excitation tables (激励 表 )，559 
for D flip-flop (D 触发 器 )，564 
for JK flip-flop (JK 触发 器 )，564 
for SR flip-flop (SR fkA#), 559 
for T flip-flop (T 触发 器 )，564 
Exclusive OR ( 异 或 )， 参 见 XOR 


一 


FLFO page-replacement algorithm ( FIFO 页 替换 
BIE), 462-464 
Finite state machine (4 PR 1K Æ HL), 332, 346- 
360, 655, 657 
deterministic (确定 型 有 限 状 态 机 )，348，351 
direct code (直接 编码 有 限 状 态 机 )，357- 
360 
implementation of (有 限 状 态 机 的 实现 )，355-357 
empty transition in (有 限 状 态 机 中 的 空转 移 )， 
349-351 
nondeterministic( 非 确定 型 有 限 状 态 机 )， 
348-349 
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simplified (人 简化 的 有 限 状 态 机 )，347-348 
table-lookup implementation of (有 限 状 态 机 
的 查找 表 实 现 )，355-357 
First-fit algorithm (最 先 适 配 算 法 )，454 
Flash memory (闪存 )，581 
Floating point representation( 浮 点 数 表 示 )，118-130 
for loop (for 循环 )，46-47，252-253 
FORTRAN, 256, 259 
Format trace tag (格式 跟踪 标签 )， 参 见 Trace tag 
Full adder (全 加 器 )， 参 见 Adder 
Functions (Kt), ŚJ Parameter 
call mechanism ( pK 2X Ha] AAPL), 35, 263, 
265, 269 
prototype (图 数 原 型 )，72 
void〈 空 图 数 )，48-50，260-267 


G 


Gate delay〈 门 延迟 )，506 
Global varible (全 局 变量 )， 参 见 Variable 
Goto controversy (Goto 争议 ) 
Grammar (if?&), 332, 335-346 
context sensitive (上 下 文 有 关 语 法 )，338- 
339, 346 
for C++ identifiers (C++ 标识 符 语 法 )，336-337 
for C++ language (C++ 语言 语法 )，341-346 
for expressions (表达 式 语 法 )，340-341 
for signed integer (有 符号 整数 的 语法 )， 
337-338 
four parts of (语法 的 4 个 部 分 )，335 


H 


Galf adder ( 半 加 器 )， 参 见 Adder 

Hamming distance( 海 明 距 离 )，471 

Hardware (ff), 10-17 

Hazard (fa#), AJ Pipelining 

Heap (HE), JIL C++ memory model 

Hexadecimal represntaion (十 六 进 制 表 示 )，112-115 
Hidden bit (隐藏 位 )，121-122 

HOL6, 8-10 
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Idempotent property (7 & JA TE), & J Boolean 
algebra 
Identity element (单位 元 )，333 
IEEE 754 floating point ( 浮 点 表示 )，127-130 
if statement (if 语句 )，41-43，245-246，247-249 
Immediate addressing (5z BI t hk), KW 
Addressing mode 
Indexed addressing (484i F4), I Addressing 
mode 
Indirect addressing (间接 寻 址 )， 参 见 Addressing 
mode 
Instruction reordering (指令 重 排 序 )， 
Pipelining 
Instruction set (844) 
MIPS (48248), 627-628 
Pep/8 at ISA3 (ISA3 层 的 Pep/8 #8442), 155 
Pep/8 at AsmbS ( Asmb5 层 的 Pep/8 指令 集 )， 
193 
Instruction specifice (指令 指示 符 )，154-156 
Integer (整数 ) 
conversions (整数 转换 )， 和 参见 Base conversion 
range for signed (有 符号 整数 的 范围 )，99-101 
range for unsigned (无 符号 整数 的 范围 )，94-95 
signed binary representaion (有 符号 整数 的 
二 进 制 表示 )，97-99 
unsigned binary representation (无 符号 整数 
的 二 进 制 表示 )，91-92 
Invert instruction( 按 位 取 反 指令 )，164 
Inverter (AHF), 497-499 
ISA3, 8-10 


参见 


J 


JK flip-flop (JK ESF), 560-562 
join operator (join 操作 符 )，25-26 


K 


Karnaugh map (FBI), 512-523 
don’t care conditions (ERZI), 522-523 
dual (X41), 521-522 


four-variable (四 变量 卡 诺 图 )，$18-S$21 
three-variable (三 变量 卡 诺 图 )，512-518 


L 


Language (语言 )，333-334 
Latency (EIR), 466 
LDr instruction (LDr #4), 198-200, 608-611 
LG1, 8-10 
Linked data stuctures (链接 的 数据 结构 )，77-80， 
314-318 
Load byte instruction( 加载 字 节 指令 )，165-166 
Load instruction〈 装 人 指令 )，158-159 
Loader (加 载 器 )，392-395 
relocatable (可 重 定 位 的 )，449 
Local variable (局 部 变量 )， 参 见 Variable 
Logic diagram (逻辑 图 )，497-499，501 
and boolean expression (逻辑 图 和 布尔 表达 
式 )，501-503 
Logical addrss (Z Heh), 449-450, 458 
LRU pahe-replacement algorithm (页 替换 算法 )， 
464 
lui instruction, MIPS (1ui 指令 ，MIPS )，633 


-Iw instuction, MIPS (1w 指令 ，MIPS)，629-630 


M 


Machine vector (HL), 182-183 

MAR, 599 | 

Mark I computer (Mark I 计算 机 )，89 

Master-slave SR flip-flop ( 主 - 从 SR 触发 器 )， 
554-559 

MDR, 599 

Megahertz myth ( 主 频 神话 )，655 

Memory (存储 器 )，16 
alignment (内 存 对 齐 )，613-614 
hierarchies (存储 器 层次 结构 )，642 
main, of Pep/8 (Pep/8 的 主 存 )，151-153 392 
map of Pep/8 (Pep/8 的 内 存 图 )，182 
random access(〈 随 机 访问 存储 器 )， 181 
read-only (只 读 存储 器 )，181-182 
subsystems (存储 器 子 系统 )，577-581 


Memory model (AW ## #& #1), # IL C++ memory 
model 
Microcode〈 微 代码 )，621-624 
Minterm (最 小 项 )，510,，512 
MIPS, 624-634, 624-655 
Mnemonics( 助 记 符 )，192-194 
Monostable multivibrator ( 单 稳 多 谐振 荡 器 )，580 
Moore’s Law (摩尔 定律 )，614 
MOVSPA instuction (MOVSPA 指令 )，280-281 
Multiple token recognizers (多 语言 符号 识别 器 )， 
351-354, 361-368 
Multiplexer (42 FA#h), 525-526 
Multiplication algorithm (乘法 算法 ) 
iterative, Probem 6.24 (迭代 的 ， 问 题 6.24 )， 
324-325 
. recursive, Problem 6.18( 递 归 的 ， 问 题 6.18), 
323 
Multiprocessing (多 处 理 )，423，425 
Multiprogramming (多 道 程序 设计 ) ，421，425 
fixed-partion (固定 分 区 的 )，448-451 
variable-partition (可 变 分 区 的 )，452-454 
Mutual exclusion (H.JF ), 427-435 


N 


N bit (N fiz), 106, 150-151, 533, 599 

NaN, 124 

NAND gate (NAND JJ), 498 

NAND-NAND circuit (NAND-NAND Hit), 508-509 

NEG operation (NEG 运算 )，98-99 

Negate instruction ( 取 负 指令 )，164-165 

Negative bit 《负数 位 )， 参 见 bit 

new operator (new 操作 符 ) 35, 74-75, 300-306 

Nondeterministic FSM ( 非 确定 性 FSM)， 参 见 
Finite state machine 

NOP instruction (NOP 指令 )，194，396 ，406-407 

NOPn instruction (NOPn ##4), 194, 396, 406-407 

NOR-NOR circuit (NOR-NOR 电路 )，509 

NOR gate (NOR 门 )，498 

NOT operation (NOT 运算 )，98-99 

Nybble (4 位 字 节 )，394-395 
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Octal (八进制 )，92 

One shot device ( 单 次 设备 )， 
multivibrator 

Ones’ complement (45), 98 

Opcode (操作 码 )，154 
unimplemented (未 实现 的 操作 码 )，194 

Operand specifier (操作 数 指示 符 )，154-156 

Operating system (操作 系 统 )，19-20，391 

Optimization (优化 ) 
compiler (优化 编译 器 )， 参 见 C++ 
hardware (优化 硬件 )，619-621 

OR-AND circuit (OR-AND 电路 )，507-509 

OR gate (OR IJ), 497-499 

OR operator (OR 运算 符 )，107-108 

Or instruction (Or #84), 162-163 

ORA instruction (ORA 4##4>), 198-200 

ori instruction, MIPS (ori #84, MIPS), 633 

Overflow bit (溢出 位 )， 参 见 V bit 


4 见 Monostable 


DD 


Paging (分 页 )，455-457 
Parallelism (并 行 )，612-613 
Parameter (参数 ) 
array( 数 组 参数 )，291-297 
call-by-reference( 传 引用 调用 参数 )，51-55， 
273-277，277-281 
call-by-value〔 传 值 调 用 参数 )，48-51，263-269 
Parity bit (奇偶 位 )，470 
Parser (分析 器 )，331，381-382 
Parsing problem (分 析 问 题 )，339-340 
PCB, 397, 421-423 
Pefect code (完美 编码 )，475 
Peterson’s algorithm (算法 )，429-431 
Pipelining (流水线 )，646-655 
control hazard (控制 危害 )，650 
dynamic branch prediction (动态 分 文 预 测 )， 
650-652 
data forwrding (数据 传送 )，653 
hazard (危害)，647 
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_ instruction reordeing (484 HE FEFF ), 653-654 
RAW data hazard (数据 危害 )，652-653 
superscalar machines (ttn Ht@L#E ), 653-654 
WAR data hazard (WAR 数据 危害 )，654 
Pointers (指针 )，74-76 

assignment rule (指针 分 配 原 则 )，75 

global (全 局 指针 )，300-306 

local (局 部 指针 )，306-309 

zero as a special value 〈 委 作为 特殊 值 的 指针 )，78 
Pop operation( 弹 出 操作 )，35 
Preset flip-flop line〈 预 设置 触发 需 线 )，569 
Process (进程 )，397 

concurrent (并 发 进程 )，419-437 
Process control block( 进 程控 制 块 )， 参 见 PCB 
Productions in a grammar (语法 的 产生 式 )，336 
Program (程序 )，18 

analysis vs.design (分 析 vs. 设计 )，21 

self-modifying (自我 修改 )，177-179 
project operator (project 操作 符 )，25-26 
PROM, 581 
Push operation (EARE), 35 


Q 


Queue of PCB (PCB 队列 )，420-423 


R 


RAID storage system (存储 系统 )，476-483 

Level 0:Nonredundant striped (RAID 0 级 : 
非 元 余 条 带 化 )，477-478 

Level 1: Mirrored (RAID 1 级 : 镜像 )，478 

Levels 01 and 10: Striped and mirrored ( RAID 
01 和 10 级 : 条 带 化 和 镜像 )，478-480 

Level 2:Memory-style ECC (RAID 2 级 : 内 存 
风格 的 ECC), 480-481 

Level 3:Bit-inteleaved parity (RAID 3 级 : 位 
交叉 奇偶 校 验 )，481-482 

Level 4:Block-inteleaved parity (RAID 4 级 : 

FRAC M AY HAIG), 482-483 

Level 5; Block-interleaved distributed parity 
(RAID 5 级 : 块 交 叉 分 布 奇偶 校 验 )，482- 


483 
RAM, 181-182, 577-580 
RAW data hazard (RAW 数据 危害 )， 参 见 Pipelining 
Recursion (36/5), 55-74 
cost of (递归 的 开销 )，73-74 
and mathematical induction〈 递 归 的 数学 推导 )，60 
mutual (相互 递归 )，72-73 
Peduced Instruction Set Computer (精简 指令 集 计 
算 机 )， 参 见 RISC 
Pegister (AFAR ) 
base and bound( 基 址 和 边界 寄存 器 )，450 
implementation of (寄存 器 的 实现 )，574-575 
MIPS (MIPS 寄存 器 )，625 
Pep/8 (Pep/8 寄存 器 )，150-151 
two-port bank for Pep/8 ( Pep/8 的 双 端 口 寄 
存 器 体 )，588-590 
Register transfer language (寄存 器 传送 语言 )， 
108-109 
Regular expression (正则 表达 式 )，332 
Relational operator (关系 运算 符 )，41 
Resource allocation graph (资源 分 配 图 )，435-437 
RETn instruction (RETn 指令 )，260-263 
RETTR instruction (RETTR 指令 )，397-398 
RISC, 489-490, 620 
ROL operation (ROL 324%), 111-112 
ROLr instruction (ROLr #§4), 224-226 
ROM, 181-182, 581 
ROR operation (ROR 运算 )，111-112 
RORr instruction (RORr #4), 224-226 
Rotate left operation〈 循 环 左 移 运算 )， 参 见 ROL 
Rotate right operation (循环 右 移 运算 )， 参 见 ROR 
Run-time stack (运行 时 栈 )，35，238-241 


S 


Seek time ( 寻 道 时 间 )，466 

select operator (select 操作 符 )，25-26 
Semantics (语义 )，331 

Semaphore (信和 号 量 )，431-435 

Set, bit-mapped represention (集合 ， 位 图 表示 )，402 
Set interpretation of boolean algebra (布尔 代数 的 


集合 解释 )，500 

Sign bit (符号 位 )，97 

sll instruction, MIPS (s11 指令 ，MIPS)，631-632 

Software (4k), 17-22 

Space/time tradeoff (空间 / ATE] Dr), 612-613 
combinal circuitsv (4A 44H), 508, 523 
Exercise 10.46 (练习 10.46), 546 

Spaghetti code (面条 代码 )，253-256 

Specialized hardware unit( 特 殊 的 人 硬件 单元 ) 
Exercise 12.15 (练习 12.15 )，660 
MIPS, 642, 644, 
Pep/8, 615-619 

Spin lock (旋转 锁 )，431 

SR latch (SR 锁 存 器 )，550-552 

SRAM, 580 

Stable state( 稳 态 )， 参 见 State 

Stack (#%), 35 

Stack-indexed addressing (RÆ ht Fut), AW 
Addressing mode 

Stack-indexed defenrred addressing ( 栈 变 址 间接 寻 
hk), J Addressing mode 

Stack-relative addressing (#&% #8 Xf = HE), 
Addressing mode 

Stack-relative deferred addressing(〈 栈 相对 间接 寻 
址 )， 参 见 Addressing mode 

State (状态 )，549-550 

State transition diagram (状态 转移 图 )，346-347 
for SR flip-flop (SR 触发 器 的 状态 转移 图 )，558 

State transition table (RAB), 347 

STBYTEA instruction (STBYTEA #84), 198-200, 
606-607 

Stop instruction (停止 指令 )，158 

STOP instruction (STOP 指令 )，195-196，216 

Store byte instruction (存储 字 节 指令 )，165-166 

Store instruction〈 存 储 指令 )，159-160 

STRO instruction ( STRO 指 令 ), 194, 206-207, 

215-217, 396, 417-419 

Structured programming theorem (结构 化 编程 定 
律 )，257 

Stucture (结构 )，76-77，310-314 
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SUBSP instruction (SUBSP 指令 )，238 

Subtract instruction( 减 法 指令 )，161-162 

Subtracter (减法 器 )， 参 见 Adder/subtracter 

Subtraction, binary (减法 ， 二 进 制 )，537-539 

Superscalar machines (超标 量 机 器 )， 参 见 
Pipelining 

Supervisor call (管理 程序 调用 )，420 

sw insstruction (sw 指令 )，MIPS，630，645 

switch statement (switch 语句 )，43-44，297-300 

Symbol trace tags (符号 跟踪 标签 )， 参 见 Trace 
tag 

Symbol tracer (F5 ERIKA), 223 

Symbols (#43), 211-213, 217-218 

Syntax (GAVE), 331 

Syntax tree( 语 法 树 )，341 


T 


T flip-flop (T 触发 器 )，563 
Thompson, Ken, 460 
Time out (超时 )，420 
Timing diagram (时 序 图 ) 
of clocked SR flip-flop (PPE SR 触发 器 时 序 图 ) 
of master-slave SR flip-flop ( 主 - 从 SR 触发 
arr Ny Fe E) 
of SR latch (SR BifFARIN FAI), 552 
of von Neumann cycle (5 + 诺 依 曼 周 期 的 时 
序 图 )，603 
Token (语言 从 号)，351 
Trace tags《〈 跟 踩 标签 )，223 
format (格式 跟踪 标签 )，223，243 ，288 
symbol (符号 跟 踊 标签 )，243 
Transmission time (传送 时 间 )，466 
Trap handlers( 隐 阱 处 理 程序 ) 
DECI, 408-414 
DECO, 414-417 
NOP, 406-407 
NOPn, 406-407 
STRO, 417-419 
Trap (ABE), 396-419 
mechanism (fa BFL), 396-397 
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Tri-state buffer (三 态 缓冲 区 )，576，579 
Truth table ( 真 值 表 )，491，501 
and boolean expression( 真 值 表 和 布尔 表达 
式 )，503-506 
Two-level circuit (两 级 电路 )，506-508 
Two’s complement binary representation (žb 45 二 
进 制 表示 )，97-106 
range( 补 码 二 进 制 表 示范 围 )，99-101 
Type compatibility (类 型 兼容 )，221-222 


U 


Unicode, 118 

Unimplemented opcode (未 实现 的 操作 码 )， 参 见 
Opcode 

Uniprogramming ( 单 道 程序 设计 )，448 

Unstable state( 非 稳 态 )， 参 见 State 

USB flash drive (USB 闪存 )，14 


V 


V bit (V fiz), 105-106, 150-151, 532, 533, 599 
Variable (变量 )， 参 见 C++ memory model 
attribute of (变量 的 属性 )，36 
global (全 局 变量 )，36-39，218-221，263-267， 
273-277 
local (Jay RAE), 39-41, 241-243, 267-272, 


277-281 
Virtual memory (HEA), 458-459 
von Neumann bug (73 - w(K Biwi), 174-175 
von Neumann execution cycle (44 - HK BRAT 
周期 ) 
MIPS, 626 
Pep/8 at level ISA3 (ISA3 JZ #4 Pep/8 ), 168- 
170, 205, 262-263 
Pep/8 at level LG1 (LG1 层 的 Pep/8 ), 601-604 


W 


WAR data hazard (数据 危害 )， 参 见 Pipelining 
while loop (while 循环 )，44-45，149-250 
.WORD pseudo-op ( .WORD 伪 操 作 )，198-200 
Working set (工作 集 )，458 


X 


XOR gate (XOR ?]), 498 
XOR operator (XOR 运算 符 )，107-108，283-284 


Z 


Z bit (Z fiz), 106, 150-151, 533, 599 
Zero bit (F4), AJ Z bit 
Zero theorem ( 零 元 定理 )， 参 见 Boolean algebra 


